AI

Pica와 Bright Data로 AI 에이전트 구축하기

Bright Data를 통합하여 실시간 웹 데이터 검색과 최신 신뢰할 수 있는 응답을 구현함으로써 Pica로 AI 에이전트의 성능을 극대화하는 방법을 알아보세요.
1 분 읽기
Build AI Agents with Pica & Bright Data
요약:

ChatGPT
Perplexity


이 가이드에서는 다음을 확인하실 수 있습니다:

  • Pica가 무엇이며, 외부 도구와 통합되는 AI 에이전트 구축에 탁월한 선택인 이유.
  • 데이터 검색을 위해 AI 에이전트가 타사 솔루션과 통합되어야 하는 이유.
  • Pica 에이전트 내장 Bright Data 커넥터를 활용해 웹 데이터를 수집하여 더 정확한 응답을 제공하는 방법.

자, 시작해 보겠습니다!

Pica란 무엇인가요?

Pica는 AI 에이전트와 SaaS 통합을 신속하게 구축하도록 설계된 오픈소스 플랫폼입니다. 키 관리나 복잡한 설정 없이 125개 이상의 타사 API에 간편하게 접근할 수 있도록 지원합니다.

Pica의 목표는 AI 모델이 외부 도구 및 서비스와 손쉽게 연결되도록 하는 것입니다. Pica를 사용하면 몇 번의 클릭만으로 통합을 설정하고 코드에서 쉽게 활용할 수 있습니다. 이를 통해 AI 워크플로가 실시간 데이터 검색, 복잡한 자동화 처리 등을 수행할 수 있습니다.

이 프로젝트는 GitHub에서 단 몇 달 만에 1,300개 이상의 스타를 모으며 빠르게 인기를 얻었습니다. 이는 강력한 커뮤니티 성장과 채택을 보여줍니다.

AI 에이전트에 웹 데이터 통합이 필요한 이유

모든 AI 에이전트 프레임워크는 기반이 되는 대규모 언어 모델(LLM)의 핵심적 한계를 상속받습니다. LLM은 정적 데이터셋으로 사전 훈련되었기 때문에 실시간 인식 능력이 부족하며, 라이브 웹 콘텐츠에 안정적으로 접근할 수 없습니다.

이로 인해 답변이 오래되었거나 심지어 허구적인 답변을 내놓는 경우가 빈번합니다. 이러한 한계를 극복하기 위해 에이전트(및 그들이 의존하는 LLM)는 신뢰할 수 있고 최신 웹 데이터에 접근할 수 있어야 합니다. 왜 웹 데이터일까요? 웹은 여전히 가장 포괄적이고 최신 정보를 제공하는 출처이기 때문입니다.

따라서 효과적인 AI 에이전트는 타사 AI 웹 데이터 공급자와 신속하고 쉽게 통합될 수 있어야 합니다. 바로 여기에 Pica가 등장합니다!

Pica 플랫폼에서는 Bright Data를 포함한 125개 이상의 통합 솔루션을 이용할 수 있습니다:

The Bright Data integration on Pica

Bright Data 통합을 통해 AI 에이전트와 워크플로가 다음에 원활하게 연결됩니다:

  • 웹 언락커 API: 봇 방어 기능을 우회하는 고급 스크래핑 API로, 모든 웹 페이지의 콘텐츠를 마크다운 형식으로 제공합니다.
  • 웹 스크레이퍼 API: 아마존, 링크드인, 인스타그램 등 40여 개 인기 사이트에서 윤리적으로 최신 구조화된 데이터를 추출하는 전문 솔루션입니다.

이러한 도구들은 AI 에이전트, 워크플로우 또는 파이프라인이 관련 페이지에서 실시간으로 추출한 신뢰할 수 있는 웹 데이터로 응답을 뒷받침할 수 있게 합니다. 다음 장에서 이 통합 기능을 실제로 확인해 보세요!

Pica와 Bright Data를 활용해 웹에서 데이터를 검색하는 AI 에이전트 구축 방법

이 가이드 섹션에서는 Pica를 사용하여 Bright Data 통합에 연결하는 Python AI 에이전트를 구축하는 방법을 배웁니다. 이렇게 하면 에이전트가 Amazon과 같은 사이트에서 구조화된 웹 데이터를 검색할 수 있습니다.

Pica로 Bright Data 기반 AI 에이전트를 생성하려면 아래 단계를 따르세요!

필수 조건

이 튜토리얼을 따라하려면 다음이 필요합니다:

  • 컴퓨터에 설치된 Python 3.9 이상 (최신 버전 권장).
  • Pica 계정.
  • Bright Data API 키.
  • OpenAI API 키.

아직 Bright Data API 키나 Pica 계정이 없더라도 걱정하지 마세요. 다음 단계에서 설정 방법을 안내해 드리겠습니다.

1단계: Python 프로젝트 초기화

터미널을 열고 Pica AI 에이전트 프로젝트를 위한 새 디렉터리를 생성하세요:

mkdir pica-bright-data-agent

pica-bright-data-agent 폴더에는 Pica 에이전트용 Python 코드가 포함됩니다. 이 코드는 웹 데이터 수집을 위해 Bright Data 통합 기능을 사용합니다.

다음으로 프로젝트 디렉터리로 이동하여 가상 환경을 생성합니다:

cd pica-bright-data-agent
python -m venv venv

이제 선호하는 Python IDE에서 프로젝트를 엽니다. Python 확장 프로그램이 설치된 Visual Studio Code 또는 PyCharm Community Edition을 권장합니다.

프로젝트 폴더 내에서 agent.py라는 새 파일을 생성하세요. 디렉터리 구조는 다음과 같아야 합니다:

pica-bright-data-agent/
├── venv/
└── agent.py

터미널에서 가상 환경을 활성화하세요. Linux 또는 macOS에서는 다음 명령을 실행합니다:

source venv/bin/activate

Windows에서는 다음 명령을 실행하세요:

venv/Scripts/activate

다음 단계에서는 필요한 Python 패키지를 설치합니다. 가상 환경을 활성화한 상태에서 지금 바로 모든 것을 설치하려면 다음 명령어를 실행하세요:

pip install langchain langchain-openai pica-langchain python-dotenv

이제 준비 완료! Pica에서 Bright Data 통합 기능을 갖춘 AI 에이전트를 구축할 수 있는 Python 개발 환경이 마련되었습니다.

2단계: 환경 변수 설정

에이전트는 Pica, Bright Data, OpenAI와 같은 타사 서비스에 연결됩니다. 이러한 통합의 보안을 유지하려면 API 키를 Python 코드에 직접 하드코딩하지 마십시오. 대신 환경 변수로 저장하세요.

환경 변수 로딩을 쉽게 하려면 python-dotenv 라이브러리를 활용하세요. 활성화된 가상 환경에서 다음 명령어로 설치합니다:

pip install python-dotenv

다음으로, 라이브러리를 임포트하고 에이전트 파일 (agent.py ) 상단에 load_dotenv()를 호출하여 환경 변수를 로드하세요:

import os
from dotenv import load_dotenv

load_dotenv()

이 함수는 로컬 .env 파일에서 변수를 읽을 수 있게 합니다. 프로젝트 디렉토리 루트에 이 .env 파일을 생성하세요. 폴더 구조는 다음과 같습니다:

pica-bright-data-agent/
├── venv/
├── .env         # <-----------
└── agent.py

좋습니다! 이제 환경 변수를 사용하여 API 키 및 기타 비밀 정보를 안전하게 처리할 준비가 되었습니다.

3단계: Pica 설정

아직 계정이 없다면 무료 Pica 계정을 생성하세요. 기본적으로 Pica가 API 키를 생성해 줍니다. 이 API 키를 LangChain이나 기타 지원되는 통합 서비스에서 사용할 수 있습니다.

“Quick start” 페이지로 이동하여 “LangChain” 탭을 선택하세요:

Opening the “LangChain” tab

여기서 LangChain에서 Pica를 시작하는 방법을 확인할 수 있습니다. 특히, 표시된 설치 명령어를 따르세요. 활성화된 가상 환경에서 다음을 실행하세요:

pip install langchain langchain-openai pica-langchain

이제 “API 키” 섹션까지 아래로 스크롤하세요:

Clicking the “Copy to clipboard” button in the “API Key” section

“클립보드에 복사” 버튼을 클릭하여 Pica API 키를 복사하세요. 그런 다음 다음과 같이 환경 변수를 정의하여 .env 파일에 붙여넣으세요:

PICA_API_KEY="<YOUR_PICA_KEY>"

<YOUR_PICA_KEY> 자리 표시자를 방금 복사한 실제 API 키로 대체하세요.

훌륭합니다! 이제 Pica 계정이 완전히 설정되어 코드에서 사용할 준비가 되었습니다.

4단계: Pica에 Bright Data 통합

시작하기 전에 공식 가이드를 따라 Bright Data API 키를 설정하세요. Pica 플랫폼의 내장 통합 기능을 사용하여 에이전트를 Bright Data에 연결하려면 이 키가 필요합니다.

이제 API 키를 확보했으므로 Pica에 Bright Data 통합을 추가할 수 있습니다.

Pica 대시보드의 “LangChain” 탭에서 아래로 스크롤하여 “최근 통합” 섹션으로 이동한 후 “통합 찾아보기” 버튼을 누르세요:

Clicking the “Browse integrations” button

모달 창이 열립니다. 검색창에 “brightdata”를 입력하고 “BrightData” 통합을 선택하세요:

Selecting the BrightData integration

앞서 생성한 Bright Data API 키를 입력하라는 메시지가 표시됩니다. 키를 붙여넣은 후 “연결” 버튼을 클릭하세요:

Pasting your Bright Data API key and pressing “Connect”

다음으로 왼쪽 메뉴에서 “연결된 통합” 메뉴 항목을 클릭하세요:

Clicking the “Connected integrations” menu item

“연결된 통합” 페이지에서 Bright Data가 연결된 통합으로 표시됩니다. 테이블에서 “클립보드에 복사” 버튼을 클릭하여 연결 키를 복사하세요:

Copying the Pica Bright Data connection key

그런 다음 .env 파일에 다음을 추가하여 붙여넣으세요:

PICA_BRIGHT_DATA_CONNECTION_KEY="<YOUR_PICA_BRIGHT_DATA_CONNECTION_KEY>"

<YOUR_PICA_BRIGHT_DATA_CONNECTION_KEY> 자리 표시자를 복사한 실제 연결 키로 반드시 교체하세요.

이 값은 코드에서 Pica 에이전트를 초기화하여 구성된 Bright Data 연결을 로드하도록 지시하는 데 필요합니다. 다음 단계에서 해당 방법을 확인하세요!

5단계: Pica 에이전트 초기화

agent.py 파일에서 다음 코드로 Pica 에이전트를 초기화하세요:

pica_client = PicaClient(
    secret=os.environ["PICA_API_KEY"],
    options=PicaClientOptions(
        connectors=[
            os.environ["PICA_BRIGHT_DATA_CONNECTION_KEY"]
        ]
    ))

pica_client.initialize()

위 코드 조각은 환경 변수에서 불러온 PICA_API_KEY 비밀 키를 사용하여 Pica 계정에 연결하는 Pica 클라이언트를 초기화합니다. 또한 사용 가능한 모든 커넥터 중에서 이전에 구성한 Bright Data 통합을 선택합니다.

이는 이 클라이언트로 생성하는 모든 AI 에이전트가 Bright Data의 실시간 웹 데이터 검색 기능을 활용할 수 있음을 의미합니다.

필요한 클래스를 반드시 임포트하세요:

from pica_langchain import PicaClient
from pica_langchain.models import PicaClientOptions

훌륭합니다! 이제 LLM 통합을 진행할 준비가 되었습니다.

6단계: OpenAI 통합

Pica 에이전트는 입력 프롬프트를 이해하고 Bright Data의 기능을 활용하여 원하는 작업을 수행하기 위해 LLM 엔진이 필요합니다.

이 튜토리얼에서는 OpenAI 통합을 사용하므로, 에이전트용 LLM을 agent.py 파일에 다음과 같이 정의합니다:

llm = ChatOpenAI(
    model="gpt-4o",
    temperature=0,
)

문서 내 모든 Pica LangChain 예제는 temperature=0을 사용합니다. 이는 모델이 결정론적(deterministic)으로 동작하여 동일한 입력에 대해 항상 동일한 출력을 생성하도록 보장합니다.

ChatOpenAI 클래스는 다음 임포트에서 제공됨을 기억하세요:

from langchain_openai import ChatOpenAI

특히 ChatOpenAI는 OPENAI_API_KEY라는 환경 변수에 OpenAI API 키가 정의되어 있을 것을 기대합니다. 따라서 .env 파일에 다음을 추가하세요:

OPENAI_API_KEY=<YOUT_OPENai_API_KEY>

<YOUR_OPENAI_API_KEY> 자리 표시자를 실제 OpenAI API 키로 대체하세요.

훌륭합니다! 이제 Pica AI 에이전트를 정의하기 위한 모든 구성 요소를 갖추셨습니다.

7단계: Pica 에이전트 정의하기

Pica에서 AI 에이전트는 세 가지 주요 부분으로 구성됩니다:

  1. Pica 클라이언트 인스턴스
  2. LLM 엔진
  3. Pica 에이전트 유형

이 경우 OpenAI 함수를 호출할 수 있는 AI 에이전트를 구축하고자 합니다(해당 함수는 Pica 통합을 통해 Bright Data의 웹 검색 기능과 연결됩니다). 따라서 다음과 같이 Pica 에이전트를 생성하세요:

agent = create_pica_agent(
    client=pica_client,
    llm=llm,
    agent_type=AgentType.OPENAI_FUNCTIONS,
) 

필요한 임포트 추가를 잊지 마세요:

from pica_langchain import create_pica_agent
from langchain.agents import AgentType

훌륭합니다! 이제 남은 것은 데이터 검색 작업에서 에이전트를 테스트하는 것뿐입니다.

8단계: AI 에이전트에 질문하기

Bright Data 통합이 Pica 에이전트에서 제대로 작동하는지 확인하려면, 에이전트가 단독으로는 수행할 수 없는 작업을 부여하세요. 예를 들어, 최근 아마존 제품 페이지(예: 닌텐도 스위치 2, https://www.amazon.com/dp/B0F3GWXLTS/)에서 업데이트된 데이터를 검색하도록 요청하세요.

이를 위해 다음 입력으로 에이전트를 호출하세요:

agent_input = """
Bright Data를 사용하여 웹 스크래핑 작업을 실행하고 다음 Amazon 제품 URL의 결과를 반환하세요:

"""
result = agent.invoke({
    "input": agent_input
})

참고: 프롬프트는 의도적으로 명시적입니다. 에이전트에게 정확히 무엇을 해야 하는지, 어떤 페이지를 스크래핑할지, 어떤 통합 도구를 사용할지 알려줍니다. 이는 LLM이 Pica를 통해 구성된 Bright Data 도구를 활용하여 예상 결과를 생성하도록 보장합니다.

마지막으로 에이전트 출력을 출력합니다:

print(f"n에이전트 결과:n{result}")

이 마지막 줄로 Pica AI 에이전트 구현이 완료되었습니다. 이제 모든 것이 작동하는 모습을 확인해 볼 시간입니다!

9단계: 모든 것 통합하기

이제 agent.py 파일에는 다음 내용이 포함되어야 합니다:

import os
from dotenv import load_dotenv
from pica_langchain import PicaClient, create_pica_agent
from pica_langchain.models import PicaClientOptions
from langchain_openai import ChatOpenAI
from langchain.agents import AgentType

# .env 파일에서 환경 변수 로드
load_dotenv()

# 특정 Bright Data 커넥터로 Pica 클라이언트 초기화
pica_client = PicaClient(
    secret=os.environ["PICA_API_KEY"],
    options=PicaClientOptions(
        connectors=[
            os.environ["PICA_BRIGHT_DATA_CONNECTION_KEY"] # 특정 Bright Data 연결 로드
        ]
    )
)
pica_client.initialize()

# LLM 초기화
llm = ChatOpenAI(
    model="gpt-4o",
    temperature=0,
)

# Pica 에이전트 생성
agent = create_pica_agent(
    client=pica_client,
    llm=llm,
    agent_type=AgentType.OPENAI_FUNCTIONS,)


# 에이전트에서 웹 데이터 검색 작업 실행
agent_input = """
Bright Data를 사용하여 웹 스크래핑 작업을 실행하고 다음 Amazon 제품 URL의 결과를 반환하세요:

"""
result = agent.invoke({
    "input": agent_input
})

# 생성된 출력 인쇄
print(f"n에이전트 결과:n{result}")

보시다시피, 50줄 미만의 코드로 강력한 데이터 검색 기능을 갖춘 Pica 에이전트를 구축했습니다. 이는 Pica 플랫폼에서 바로 이용 가능한 Bright Data 통합 덕분에 가능합니다.

에이전트 실행 방법:

python agent.py

터미널에서 다음과 유사한 로그를 확인할 수 있습니다:

# 생략...
2026-07-15 17:06:03,286 - pica_langchain - INFO - 1개의 연결 성공적으로 가져옴
# 생략...
2026-07-15 17:06:05,546 - pica_langchain - INFO - 플랫폼 bright-data에 대한 사용 가능한 액션 가져오기 중
2026-07-15 17:06:05,546 - pica_langchain - INFO - 플랫폼 bright-data에 대한 사용 가능한 액션 가져옴
2026-07-15 17:06:05,789 - pica_langchain - INFO - bright-data에 대해 사용 가능한 액션 54개 발견
2026-07-15 17:06:07,332 - pica_langchain - 정보 - 플랫폼: bright-data에서 액션 ID: XXXXXXXXXXXXXXXXXXXX에 대한 지식 가져오기 중
# 간결함을 위해 생략...
2026-07-15 17:06:12,447 - pica_langchain - INFO - 플랫폼: bright-data에서 메서드: GET으로 액션 ID: XXXXXXXXXXXXXXXXXXXX 실행 중
2026-07-15 17:06:12,447 - pica_langchain - INFO - 플랫폼: bright-data, 메서드: GET에 대한 액션 실행 중
2026-07-15 17:06:12,975 - pica_langchain - INFO - bright-data를 통해 데이터셋 목록 가져오기 성공적으로 실행됨
2026-07-15 17:06:12,976 - pica_langchain - INFO - 플랫폼: bright-data에서 작업: 데이터 세트 목록 가져오기 성공적으로 실행됨
2026-07-15 17:06:16,491 - pica_langchain - INFO - 플랫폼: bright-data에서 메서드: POST로 액션 ID: XXXXXXXXXXXXXXXXXXXX 실행 중
2026-07-15 17:06:16,492 - pica_langchain - INFO - 플랫폼: bright-data, 메소드: POST에 대한 액션 실행 중
2026-07-15 17:06:22,265 - pica_langchain - INFO - bright-data를 통해 동기식 웹 스크래핑 트리거 및 결과 검색을 성공적으로 실행했습니다.
2026-07-15 17:06:22,267 - pica_langchain - INFO - 플랫폼 bright-data에서 동기식 웹 스크래핑 트리거 및 결과 검색 작업 성공적으로 실행됨

간단히 말해, Pica 에이전트가 수행한 작업은 다음과 같습니다:

  1. Pica에 연결하여 설정된 Bright Data 통합을 가져왔습니다.
  2. Bright Data 플랫폼에서 사용 가능한 도구가 54개 있음을 확인했습니다.
  3. Bright Data에서 모든 데이터 세트 목록을 검색했습니다.
  4. 사용자의 프롬프트에 따라 “동기식 웹 스크래핑 트리거 및 결과 검색” 도구를 선택하여 지정된 아마존 제품 페이지에서 최신 데이터를 스크래핑했습니다. 백그라운드에서는 아마존 제품 URL을 전달하여 Bright Data 아마존 스크래퍼 호출을 트리거합니다. 스크래퍼는 제품 데이터를 검색하여 반환합니다.
  5. 스크래핑 작업을 성공적으로 실행하고 데이터를 반환했습니다.

출력 결과는 다음과 유사하게 표시됩니다:

The output produced by the Pica agent

이 출력을 마크다운 편집기에 붙여넣으면 다음과 같이 잘 정리된 제품 보고서를 볼 수 있습니다:

The formatted output data

보시다시피, 에이전트는 아마존 제품 페이지에서 의미 있고 최신 데이터를 포함한 마크다운 보고서를 생성할 수 있었습니다. 브라우저에서 대상 제품 페이지를 방문하여 정확성을 확인할 수 있습니다:

The Nintendo Switch 2 target page on Amazon

생성된 데이터가 LLM이 허위로 생성한 것이 아닌 아마존 페이지의 실제 데이터임을 확인하세요. 이는 Bright Data 도구를 통한 스크래핑의 증거입니다. 그리고 이건 시작에 불과합니다!

Pica에서 제공되는 다양한 Bright Data 액션을 활용하면 에이전트가 사실상 모든 웹사이트에서 데이터를 추출할 수 있습니다. 여기에는 엄격한 스크래핑 방지 조치( 악명 높은 아마존 CAPTCHA 등)로 유명한 아마존과 같은 복잡한 대상도 포함됩니다.

자, 이제 보셨죠! Pica AI 에이전트 내 Bright Data 통합으로 구현된 원활한 웹 스크래핑을 경험하셨습니다.

결론

이 글에서는 Pica를 활용해 최신 웹 데이터로 응답을 뒷받침하는 AI 에이전트를 구축하는 방법을 살펴보았습니다. 이는 Pica의 내장형 Bright Data 통합 기능 덕분에 가능했습니다. Pica Bright Data 커넥터는 AI가 어떤 웹 페이지에서든 데이터를 가져올 수 있는 능력을 부여합니다.

이것은 단순한 예시일 뿐임을 명심하세요. 더 고급 에이전트를 구축하려면 실시간 웹 데이터 수집, 검증, 변환을 위한 강력한 솔루션이 필요합니다. 바로 Bright Data AI 인프라에서 이를 찾을 수 있습니다.

무료 Bright Data 계정을 생성하고 AI 활용이 가능한 웹 데이터 추출 도구를 탐색해 보세요!