オープンAIとマイクロソフト(MS)は、中国のAIスタートアップ「ディープシーク」によるデータ無断収集疑惑について調査を進めている。ディープシークは、低コストでチャットGPTを凌駕するAIモデルを発表し、アメリカに衝撃を与えた。この発表を受けて、同社がオープンAIのデータを不正に収集した可能性が浮上している。
29日(現地時間)、ウォール・ストリート・ジャーナル(WSJ)の報道によると、オープンAIはディープシーク関連グループによる自社データの無断取得についての調査を進めており、第2次トランプ政権のAI・仮想資産政策責任者に指名されたデービッド・サックス氏は、「ディープシークがオープンAIの独自技術を不正に利用して開発を進めていた証拠が多数見つかっている」と述べ、さらに「オープンAIはこの事実に強く反発していると考えられる」と語ったという。
オープンAIによると、中国拠点の複数の機関が自社のAIツールから大量のデータを抽出しようとした試みが確認され、これらは「蒸留」と呼ばれる技術的プロセスを通じて独自モデルの訓練を目的としているとみられる。オープンAIは、これらの試みを行った疑いがあるアカウントを凍結し、マイクロソフトと協力して背後にいる主体を特定したという。
「蒸留」とは、AIモデルが他のモデルの出力結果を訓練データとして使用し、類似した機能を開発する技術を指す。オープンAIは、自社システムで生成されたデータを使用して、同一市場で競合する技術の構築を許可していないとして、ディープシークが自社データを無断で収集した可能性があると指摘し、「利用規約違反の証拠を精査している」と述べている。さらに、オープンAIは「敵対者や競合他社によるアメリカの最先端技術の窃取を防ぐため、政府との緊密な協力が不可欠である」と強調し、「中国拠点の企業が主要なアメリカAI企業のモデルを継続的に蒸留しようとしている」と警告した。
ディープシークは27日(現地時間)、低価格AIチップを用いて学習した新AIモデル「R1」がオープンAIのチャットGPTを性能面で上回ると発表した。この発表を受けて、エヌビディアなど米国のAI関連株が急落し、ディープシークの衝撃は現在も米国内で続いている。一方、ディープシークについてオープンAIのサム・アルトマンCEOは「開発コストを考慮すれば印象的だ」と評価し、「新たな競合の出現は非常に刺激的だ」と述べた。その上で、「オープンAIはさらに優れたモデルを発表するだろう」と強調した。