세상은 기록되어 있다. 하지만 모두를 위한 것은 아니다.
완곡하게 말하자면, 우리는 놀라운 시대에 살고 있다. 인터넷은 인류가 만들어낸 가장 큰 데이터셋이다. 매일 수십억 개의 데이터 포인트가 생성되고, 게시되고, 공개적으로 제공된다. 가격, 정책, 트렌드, 진술, 행동 패턴, 그리고 피해의 조기 경고 신호들이 끊임없이 변화하고 있다.
이 정보는 존재한다. 그곳에 있다. 그러나 그것에 대한 접근, 즉 대규모로 수집하고 구조화하여 실제 세계에서 활용하는 능력은 여전히 극심하게 불평등하다.
엔지니어링 팀과 인프라 예산을 갖춘 대기업들에게 공개 웹 데이터는 수년간 활용해온 경쟁 우위다. 그들은 시장을 추적하고, 경쟁자를 모니터링하며, 거의 실시간으로 웹의 신호를 AI 모델에 공급한다.
그 외의 사람들은 어떨까? 온라인 피해를 모니터링하려는 소규모 비영리단체. 불평등을 연구하는 대학 연구팀. 발병의 초기 징후를 감시하는 공중보건 기관. 기업 비위를 조사하는 언론인. 이 조직들은 종종 가장 중요한 일을 하려 하지만, 극히 적은 자원으로 그 일을 해내고 있다.
이것은 단순한 불편함이 아니다. 구조적인 문제다.
그리고 데이터 접근이 불평등할 때, 결과도 불평등해진다. Bright Initiative에서 우리는 이를 바꾸기 위해 노력하고 있다.
정보 비대칭은 항상 권력을 형성해왔다. 이것은 그 최신 버전일 뿐이다.
이것은 새로운 역학이 아니다. 역사를 통해, 다른 사람들보다 빠르게 정보에 접근하고 해석하며 행동할 수 있는 자들이 우위를 점했다. 변한 것은 격차의 규모다. 상황을 재균형시킬 수 있는 정보의 상당 부분이 기술적으로 공개되어 있다는 사실이 판도를 바꿔야 한다.
디지털 시대에 권력에 책임을 묻는다는 것이 무엇을 의미하는지 생각해보라. 플랫폼이 실제로 유해한 콘텐츠를 제거하고 있는지 추적하는 것. 위성 및 센서 데이터로 환경 피해 패턴을 문서화하는 것. 정책 변화가 지역사회에 어떻게 파급되는지 이해하는 것. 그리고 허위 정보와 오정보의 시대에, 어떤 서사가 퍼지고 있는지 파악하는 것. 어디서, 얼마나 빠르게.
이 중 어느 것도 비밀 데이터를 필요로 하지 않는다. 정보는 공개되어 있다. 문제는 그것을 책임감 있게 사용하기 위한 인프라에 대한 접근이다. 안타깝게도 지금 그 인프라는 균등하게 분배되어 있지 않다.
민주화는 단순한 기술 트렌드가 아니다. 이것은 정의의 문제다.
공개 웹 데이터의 민주화에 대해 이야기할 때, 나는 근본적인 무언가를 의미한다: 세상에서 무슨 일이 일어나고 있는지 볼 수 있는 능력이 오직 가장 많은 돈을 가진 자들에게만 독점되지 않도록 보장하는 것이다.
왜냐하면 내가 비영리단체, 학자, 공공기관과 수백 건의 파트너십을 통해 관찰한 것이 있기 때문이다: 가장 중요한 일을 하는 조직들, 즉 지역사회를 보호하고, 권력에 책임을 묻고, 모두에게 이익이 되는 지식을 발전시키는 조직들이 일관되게 가장 적은 데이터 인프라를 가진 곳들이다.
그들에게 부족한 것은 지성도, 헌신도, 사명감도 아니다. 접근이 부족하다. 그리고 접근은 모든 것을 바꾼다. 소규모 조직이 마침내 대규모로 공개 정보를 수집하고 분석할 수 있게 되면, 실질적이고 가시적인 변화가 일어난다.
연구의 질이 향상된다. 옹호 활동이 증거 기반이 된다. 피해를 문서화하고, 패턴을 발견하고, 상황이 악화되기 전에 행동하는 능력이 크게 가속화된다.
책임은 진공 속에서 이루어지지 않는다
진정한 책임은 확인할 수 있는 능력을 요구한다. 말한 것과 행한 것을 비교하는 것. 개별 데이터 포인트로는 드러나지 않는 패턴을 보는 것. 그리고 그것은 지금 세계에서 소수의 행위자만이 신뢰할 수 있게 달성할 수 있는 공개 정보에 대한 체계적이고 확장된 접근을 필요로 한다.
이것이 내가 공개 웹 데이터에 대한 접근의 민주화가 단순히 좋은 일이 아니라고 믿는 이유다. 그것은 디지털 시대에 책임이 작동하는 방식의 근본이다. 한 손이 등 뒤에 묶인 채로는 권력에 책임을 물을 수 없다.
우리는 변곡점에 있다. 지금 내려지는 선택들이 중요할 것이다.
좋은 소식은 상황이 변하고 있다는 것이다. 책임 있는 데이터 접근을 둘러싼 대화는 엄청나게 성숙해졌다. 기술자, 정책 입안자, 시민사회 모두에서, 공개 웹 데이터가 강력한 힘인지 여부가 아니라는 인식이 높아지고 있다. 분명히 그렇다. 문제는 누가, 어떻게, 무엇을 위해 그것을 사용하느냐다.
그 대화에는 더 많은 목소리가 필요하다. 자신들의 이익을 논쟁하는 대형 플랫폼만이 아니라. 기술을 따라잡으려는 규제 기관만도 아니라. 연구자, 옹호자, 언론인, 교육자. 현장에서 실제로 일하는 사람들, 즉 잘 갖춰진 행위자들이 당연하게 여기는 공개 정보에 대한 동일한 접근이 무엇을 의미하는지 누구보다 잘 이해하는 사람들이 필요하다.
나는 그 접근이 확장될 때 무슨 일이 일어나는지 보았다. 불가능해 보였던 질문에 답하는 소규모 팀들을 지켜봤다. 연구자들이 대화를 바꾼 패턴을 발견하는 것을 보았다. 조직들이 직관으로 일하는 것에서 증거로 일하는 것으로 변화하는 것을 보았다.
그것은 마법이 아니다. 그것이 바로 공개 정보에 대한 접근이 실제로 어떻게 보이는지다.
내가 믿는 것
나는 인터넷, 그 공개된 부분이 소수의 경쟁 우위가 아니라 모두를 위한 자원이어야 한다고 믿는다.
나는 세상에서 가장 어려운 문제들을 다루는 조직들이 그것으로부터 이익을 창출하는 자들과 동일하게 그 세상을 이해할 수 있는 능력을 가져야 한다고 믿는다.
그리고 나는 우리가 이것을 올바르게 해낸다면, 즉 공개 웹 데이터에 대한 접근이 진정으로 민주화되고, 올바른 윤리적 프레임워크와 책임 있는 관행이 수반되는 미래를 향해 구축해 나간다면, 진정으로 놀라운 무언가를 위한 조건을 만들어낸다고 믿는다.
피해를 숨기기가 더 어려운 세상. 불의의 패턴을 부정하기가 더 어려운 세상. 항상 존재했던 신호들이 마침내 그것에 행동할 위치에 있는 사람들에게 도달하는 세상.
우리는 아직 거기에 있지 않다. 하지만 방향은 옳다. 그리고 긴박함은 실재한다.