해외 이슈

구글이 AI 도구를 훈련시키기 위해 수백만 명의 사용자로부터 데이터를 훔쳤다고 소송 제기

소중대이슈 2023. 7. 12. 23:29
반응형

구글이 AI 도구를 훈련시키기 위해 수백만 명의 사용자로부터 

데이터를 훔쳤다고 소송 제기

 

뉴욕 8번가 111번지 건물에 있는 Google 로고.
뉴욕 8번가 111번지 건물에 있는 Google 로고.

 

구글이 화요일 인공 지능 제품을 훈련하고 개발하기 위해 동의 없이 수백만 사용자의 데이터를 스크랩하고 저작권법을 위반했다고 주장하는 광범위한 소송을 당했습니다.

 

클락슨 로펌은 구글과 모회사 알파벳, 구글 AI 자회사 딥마인드를 상대로 한 집단 소송을 화요일 캘리포니아 연방법원에 제기했다. 이 회사는 지난 달 ChatGPT 제조사인 OpenAI를 상대로 유사한 소송을 제기한 바 있습니다. (OpenAI는 이전에 소송에 대한 논평 요청에 응답하지 않았습니다.)

 

고소장은 구글이 "수억 명의 미국인이 인터넷에서 만들고 공유한 모든 것을 비밀리에 훔치고" 이 데이터를 사용하여 챗봇 Bard와 같은 AI 제품을 훈련시켰다고 주장합니다. 고소장은 또한 구글이 AI 제품을 만들기 위해 "창의적이고 카피라이팅된 작품"을 포함해 "사실상 우리의 디지털 발자국 전체"를 가져갔다고 주장합니다.

 

 

Google의 법률 고문인 Halimah DeLaine Prado는 CNN에 대한 성명에서 소송의 주장이 "근거 없다"고 말했습니다. DeLaine Prado는 "오픈 웹 및 공개 데이터세트에 게시된 정보와 같은 공개 소스의 데이터를 사용하여 책임감 있고 AI 원칙에 따라 Google 번역과 같은 서비스 뒤에 있는 AI 모델을 교육한다는 점을 수년 동안 분명히 해왔습니다."라고 DeLaine Prado는 말했습니다. 

 

 

성명서는 "미국법은 공개 정보를 사용하여 새롭고 유익한 용도를 창출하는 것을 지원하며 우리는 이러한 근거 없는 주장을 반박하기를 기대한다"고 덧붙였다.

 

알파벳과 딥마인드는 논평 요청에 즉각 응답하지 않았다.

 

불만 사항은 회사가 Bard와 같은 AI 모델 및 도구를 교육하기 위해 공개적으로 액세스할 수 있는 정보를 사용할 수 있다고 명시적으로 명시한 Google의 개인 정보 보호 정책에 대한 최근 업데이트를 지적합니다.

 

 

업데이트에 대한 이전 Verge 보고서에 대한 응답으로 회사는 이 관행에 대해 정책이 "오랫동안 투명했다"고 말했으며 "이 최신 업데이트는 Bard와 같은 최신 서비스도 포함되어 있음을 명확히 합니다."

 

 

이 소송은 최근 몇 달 동안 사용자 프롬프트에 응답하여 서면 작업과 이미지를 생성하는 능력으로 인해 새로운 AI 도구 작물이 엄청난 관심을 끌면서 발생했습니다. 이 새로운 기술을 뒷받침하는 대규모 언어 모델은 방대한 양의 온라인 데이터에 대한 교육을 통해 이를 수행할 수 있습니다.

 

 

그러나 그 과정에서 회사는 이러한 데이터 세트에 포함된 저작물의 저작권 문제와 어린이 데이터를 포함하여 일상 사용자의 개인 데이터 및 민감할 수 있는 데이터의 명백한 사용에 대한 법적 조사를 받고 있습니다.

 

 

구글을 상대로 소송을 제기한 클락슨의 변호사 중 한 명인 팀 지오다노는 인터뷰에서 CNN과의 인터뷰에서 "구글은 '공개적으로 이용 가능하다'는 것이 어떤 목적으로도 무료로 사용할 수 있다는 것을 의미하지 않는다는 점을 이해해야 한다"고 말했다. "우리의 개인 정보와 데이터는 우리의 재산이며 가치가 있으며 누구도 그것을 가져가서 어떤 목적으로든 사용할 권리가 없습니다."

 

 

이 소송은 Bard와 같은 Google의 생성 AI 도구에 대한 상업적 액세스 및 상업적 개발을 일시적으로 중단하는 형태로 금지 명령 구제를 모색하고 있습니다. 또한 구글에 의해 데이터가 유용된 것으로 의심되는 사람들에게 금전적 보상으로 명시되지 않은 손해 배상 및 지불을 요구하고 있습니다. 회사는 미성년자를 포함해 8명의 원고를 배치했다고 밝혔다.

 

 

Giordano는 Google이 핵심 검색 엔진을 지원하기 위해 일반적으로 온라인 데이터를 인덱싱하는 방식의 이점과 주장된 피해를 AI 도구를 훈련시키기 위해 데이터를 스크랩한다는 새로운 주장과 대조했습니다.

 

 

구글은 검색 엔진을 통해 "실제로 누군가가 그것을 구매하거나 참여하도록 유도할 수 있는 귀하의 작업에 대한 속성 링크를 제공"할 수 있다고 그는 말했습니다.

 

그러나 AI 도구를 교육하기 위한 데이터 스크래핑은 "누구나 작업을 구매해야 하는 인센티브를 근본적으로 변경하는 작업의 대안 버전"을 만들고 있다고 Giordano는 덧붙였습니다.

 

 

일부 인터넷 사용자는 디지털 데이터가 수집되어 검색 결과 또는 대상 광고에 사용되는 데 익숙해졌을 수 있지만 AI 교육의 경우에는 그렇지 않을 수 있습니다. Giordano는 "사람들은 자신의 정보가 이런 식으로 사용될 것이라고 상상하지 못했습니다."라고 말했습니다.

 

 

법률 회사의 파트너인 Ryan Clarkson은 Google이 일상적인 필요에 따라 인터넷을 사용할 수 있는 능력을 유지하면서 AI 훈련에 데이터를 사용하는 것을 "사람들이 선택 해제할 수 있는 기회를 만들어야" 한다고 말했습니다.

 

#구글 #AI #GOOGLE #소송 #데이터 #인터넷 #GPT #알파벳

반응형