Bright Data
Summary
AI와 데이터 분석을 위한 웹 데이터 인프라 SaaS. 단순 프록시가 아니라, 봇 차단·동적 페이지·캡차·자바스크립트 챌린지·브라우저 핑거프린트 등 각종 방어막을 우회해 에이전트가 원하는 데이터에 도달할 수 있도록 에이전트 위에 웹 접근 인프라 레이어를 더한다.
AI와 데이터 분석을 위한 웹 데이터 인프라 SaaS. 단순 프록시가 아니라, 봇 차단·동적 페이지·캡차·자바스크립트 챌린지·브라우저 핑거프린트 등 각종 방어막을 우회해 에이전트가 원하는 데이터에 도달할 수 있도록 에이전트 위에 웹 접근 인프라 레이어를 더한다.
핵심 서비스 (4 trk)
| 트랙 | 설명 |
|---|---|
| Datasets | 미리 정재·정규화된 데이터셋 마켓플레이스 (네이버 쇼핑, 쿠팡 등 한국 이커머스 포함) |
| Scrapers | TikTok, Instagram, LinkedIn 등 SNS 채널 전용 스크래퍼 사전 설계 |
| Web Access (Web Unlocker) | 핵심 서비스 — 보차단 우회, 헤더·JS 실행·캡차 처리, 검색 결과 JSON SERP API |
| AI Gateways | LLM 친화 포맷 자동 변환 (작년 신규 트랙) |
Web Unlocker
- 단순 프록시가 아닌 브라우저 자동화 세션 관리 레이어
- 헤더 처리, JS 실행, 캡차 우회 자동화
- Playwright·Puppeteer로 한계가 있는 사이트에 우회 경로 제공
- AI 에이전트의 데이터 수집 범위를 획기적으로 확장
CLI 설치
# 페이퍼클립 컨테이너 내부에서 (헤들리스 모드)
curl ... | sh
brightdata login --device콘솔 자동 세팅으로 Web Unlocker API 키 자동 발급.
왜 중요한가
“수면 아래 전쟁이 일어나고 있는 건 바로 이 데이터다. 이 데이터를 얼마나 잘, 빠르게, 정확하게 확보해서 구조화하느냐가 굉장히 중요해졌다.” — 단테 (yt-vclOMBLqVEQ-페이퍼클립-시장조사-자동생성-풀가이드)
에이전트들이 늘어나면서 봇 차단을 강화하는 서비스가 늘고 있고, 정작 고품질 정보일수록 도달이 어렵다. 데이터 인프라가 곧 AI 에이전트의 차별화 포인트가 되는 시대.
관련 노트
- Paperclip — 함께 결합되는 에이전트 운영체제
- playwright · Puppeteer — 기존 크롤링 도구 (한계 사례)
- Workflow-Automation
- Generative-AI-Automation — 데이터 수집이 자동화 파이프라인의 선행 조건
- yt-vclOMBLqVEQ-페이퍼클립-시장조사-자동생성-풀가이드 — 단테랩스 풀가이드 영상