비윤리적으로 수집된 데이터는 오래도록 유용하지 않을 것입니다

이 글은 귀사가 견고한 데이터 기반을 구축하고 모래성 같은 구조를 피할 수 있도록 실용적인 도구와 지침을 제공합니다.
1 분 읽기
Ethical Data Collection Scales of Justice blue background graphic

데이터 개인정보 보호 규정을 준수하는 것이 중요한 이유를 이미 알고 계시죠? 그렇다면 귀사의 데이터 수집 기준은 어떻습니까? 기준에 부합하고 있나요?

다음 섹션은 데이터 수집 작업이 100% 윤리적으로 운영되도록 사전 예방 조치를 취하는 데 도움이 될 것입니다:

윤리적 기준을 준수하는 프록시 제공업체 체크리스트

어떤 데이터 수집 제공업체를 선택하든, 해당 업체가 윤리적이며 합법적으로 피어(peer)를 확보하고, 귀사의 비즈니스 규모에 맞는 데이터 수집을 처리할 수 있는지 확인하는 것이 중요합니다.

다음은 고려 중인 모든 프록시/데이터 수집 제공업체에 대해 신중하게 검토하고 활용해야 할 7가지 항목의 체크리스트입니다:

#1: 프록시 소싱 – 질문 : ‘귀사는 주거용모바일 IP를 어떻게 확보하나요?’

합법적인 데이터 수집 네트워크프록시 제공업체는 피어 네트워크 애플리케이션과 소프트웨어의 구체적인 이름을 기꺼이 알려줄 것입니다.

#2: 피어 동의 – 질문 : ‘상업적 프록시 네트워크에서 피어로 기기가 활용된다는 사실을 알리고, 피어의 IP 사용에 대한 동의를 구합니까?’

실제 주거용모바일 IP를 확보하는 유일한 합법적이고 윤리적인 방법은 사용자의 사전 동의를 얻는 것입니다.

#3: 옵트아웃 – 질문 : ‘피어들이 언제든지 쉽게 네트워크에서 탈퇴할 수 있나요?’

말할 필요도 없이, 데이터 수집 P2P 네트워크의 구성원으로서 피어의 의사에 반해 억류하는 것은 매우 비윤리적입니다.

#4: GDPR 및 CCPA 준수 – 질문: ‘피어로부터 어떤 개인 식별 정보(PII)를 수집합니까? GDPR 지침에 따라 PII를 처리합니까?’

법적 준수는 대부분의 경우 윤리의 기본 원칙입니다. 고려 중인 제공자가 국제 데이터 보호 법률을 준수하는지 확인하십시오.

#5: 피어 보상 – 질문: ‘귀사의 프록시 네트워크 참여에 대해 피어에게 어떻게 보상하나요?’

개인의 자원을 활용하려는 사업체는 각 참여자에게 충분한 보상을 제공해야 합니다. 이 경우 무료 멤버십 업그레이드, 광고 없는 환경 등 참여에 대한 공정한 보상이 이루어지는지 확인하십시오.

#6: 유휴 자원 – 질문 : ‘피어의 기기를 통해 트래픽을 라우팅할 수 있는 조건은 무엇입니까? 피어의 기기가 유휴 상태이고 충분한 배터리 전력이 있을 때만 자원을 사용합니까?’

네트워크 참여자의 복지를 진정으로 고려하는데이터 수집 기업은 프록시 네트워크 트래픽 라우팅을 위해 피어의 사용자 경험을 결코 희생하지 않습니다.

#7: SDK 종료 – 질문 : ‘벤더의 SDK를 사용하는 애플리케이션이 삭제될 때 SDK도 함께 삭제되나요?’

합법적인 프록시 제공업체는 SDK가 포함된 앱이 피어의 기기에서 삭제되면 반드시 SDK도 함께 삭제되도록 보장합니다.

이는 특정 데이터 수집/프록시 제공 업체의 윤리적·법적 준수 수준을 평가하는 매우 정확하고 적용하기 쉬운 시스템입니다. 위 7개 항목 중 단 하나라도 준수하지 못할 경우 데이터 수집 및 비즈니스에 심각한 위험이 발생할 수 있으므로, 반드시 7/7 점수를 받은 제공업체만 사용해야 합니다!

편의를 위해 PDF 형식으로 쉽게 다운로드할 수 있도록 제작한 비교 차트입니다:

checklist to make sure your data collection proxy provider is ethical and ethically compliant

이미지 출처: Bright Data

데이터 수집 분야의 윤리 선구자

Bright Data는 창립 초기부터 윤리적 데이터 수집 관행의 중요성을 기업 DNA의 핵심으로 삼았습니다. 실제로 회사의 주요 사명 선언문 중 하나는 다음과 같습니다: 기업과 소비자 모두에게 이익이 되는 경쟁을 촉진할 수 있는 공정하고 윤리적인 데이터 수집 수단을 창출하는 것. Bright Data는 매우 실행 중심적인 기업으로, 창립 첫날부터 다음과 같은 사명 선언문을 실천해 왔습니다:

IP 조달 – EarnApp과 같은 P2P 프로그램을 통해 공개적이고 합의된 방식으로진행됩니다 .

‘브라이트 데이터 바운티 프로그램’ – 대중이 인지한 보안 침해 사항을 발견하고 브라이트 데이터에 알릴 수 있도록 초대합니다.

옵트아웃 약속 – 피어는 언제든지 참여를 중단할 수 있으며, Bright Data는 앱과 SDK가 파트너 기기에서 완전히 제거될 것을 약속합니다. ‘우리 SDK가 윤리적인 이유’에 대해 자세히 알아보세요 .

제3자 감사 – Bright Data는 선도적인 독립 기관과 지속적으로 협력하여 네트워크가 규제, 보안 및 법적 기준을 충족하도록 보장합니다.

질보다 양 – Bright Data는 피어 기반의 대부분을 구성하는 SDK 파트너를 신중하게 선별하여 최고 품질의 피어만이 Bright Data 네트워크에 참여하도록 보장합니다. 이는 네트워크 사용자의 보안을 위한 보증 역할을 합니다.

모두를 위한 데이터 – 자동화된 데이터 잠금 해제 기술부터 데이터 수집 자동화에 이르기까지, Bright Data는 데이터가 대기업뿐만 아니라 모든 사람이 접근할 수 있는 상품이 되도록 적극적으로 노력하고 있습니다.

윤리적 온보딩 – Bright Data는 피어 네트워크 자체의 윤리적 준수뿐만 아니라 현재 및 미래의 모든 네트워크 사용자가 합법적이고 윤리적인 용도로만 네트워크를 활용하도록 보장하기 위해 노력합니다. 이를 위해 엄격한 고객 확인(KYC) 절차, 지속적인 사용 로그 점검, 전담 컴플라이언스 책임자 및 팀을 운영합니다.

IP 재판매 금지 – Bright Data는 IP 재판매를 절대 허용하지 않습니다. 이는 프록시 네트워크 업계에서 비윤리적으로 만연해 있는 관행인 IP 재판매가 심각한 문제를 야기하기 때문입니다. IP가 재판매될 경우, 기업이 동일한 IP를 사용하기 위해 두 개의 서로 다른 공급자에게 비용을 지불하면서도 저조한 결과를 얻는 어처구니없는 상황이 발생할 수 있습니다.

Web Summit 2020 Splash Banner - The Biggest Tech Event Of The Year

이미지 출처: Bright Data

윤리적 측면을 넘어선 첨단 데이터 수집 기술

Bright Data의 CTO 론 콜과의 단독 인터뷰를 통해 기술적 진보가 비즈니스 커뮤니티를 데이터 수집의 미래로 이끌고 있는 방식을 알아봅니다.

Q: 기술적 관점에서 프록시 네트워크의 가장 중요한 요소는 무엇인가요? IP 풀 규모가 여전히 과거만큼 중요할까요, 아니면 업계가 다른 방향으로 나아가고 있나요?

A: 풀 규모는 여전히 중요하지만, 성공을 보장하기에는 더 이상 충분하지 않습니다. 웹사이트들은 네트워크 수준(IP)을 넘어 프로토콜 수준(SSL, HTTP)과 브라우저 수준(사용자 지문)까지 분석하기 시작했으며, 공개 정보에 접근하는 것조차 점점 더 어려워지고 있습니다. 이러한 수준에서 차단을 시작하는 사이트에 대해서는 성공률이 급격히 떨어질 것입니다. 높은 수준의 서비스—예를 들어 Bright Data의 Web Unlocker, Web Scraper API, Serverless Functions도구 등이 우수한 성공률을 달성하는 데 필요합니다.

Q: 현재 데이터 수집 기술의 가장 큰 도전과제는 무엇이며, 향후 10년을 내다볼 때 어떤 점이 가장 어려울까요?

A: 현재 가장 큰 과제는 공개 데이터 수집을 어떻게 상품화할 것인가입니다. 고품질 검증 데이터를 기반으로 한 대규모 신뢰할 수 있는 공개 데이터 수집 플랫폼을 구축하고, 엔지니어뿐만 아니라 모든 사람이 접근할 수 있도록 하는 방법입니다.

미래를 내다보면 기술적 도전 과제는 인덱싱된 공개 정보 통합 데이터베이스를 구축하는 것입니다. 이를 통해 구글 검색처럼 간편하게 모든 웹사이트의 공개 정보 데이터셋을 조회할 수 있어야 합니다. 공개 인터넷을 비즈니스 활용 가능한 데이터셋으로 매핑하고, 이를 투명하게 공개하여 누구나 접근할 수 있도록 하는 것이 핵심입니다.

요약

데이터를 어떤 방식으로 조달하든 윤리적으로 건전하고 법적 규정을 준수하는지 확인하는 것이 중요합니다. 고객 측에서 자체적인 독립적인 실사를 수행하는 것은 데이터 수집프록시 네트워크 측에서 수행하는 것만큼 중요합니다. 숙제를 제대로 하고 비즈니스의 동력인 데이터 엔진이 물이 아닌 기름으로 작동하도록 보장할 때, 장기적으로 비즈니스 성과가 최적화될 것이라고 확신할 수 있습니다. 차세대 데이터 수집 기술 에 접근하는 것도 결코 나쁘지 않을 것입니다.