O Openai suspeita que o DeepSeek, um modelo de IA chinês conhecido por seu custo significativamente menor, pode ter sido treinado usando os dados do OpenAI. Essa revelação, juntamente com o rápido aumento da popularidade da Deepseek, desencadeou uma desaceleração significativa do mercado para as principais empresas de IA dos EUA. A NVIDIA, uma participante importante na tecnologia GPU crucial para a IA, experimentou a maior perda de ações de um dia na história de Wall Street, perdendo quase US $ 600 bilhões em capitalização de mercado. As tecnologias Microsoft, Meta, Alphabet e Dell também sofreram perdas substanciais.
O modelo R1 da Deepseek, construído sobre o Deepseek-V3 de código aberto, possui custos de treinamento significativamente mais baixos (estimados em US $ 6 milhões) em comparação com as contrapartes ocidentais como o ChatGPT. Embora essa reivindicação seja debatida, ela alimentou preocupações sobre os enormes investimentos que estão sendo feitos pelas empresas de tecnologia americanas na IA. A popularidade do aplicativo surgiu após discussões sobre sua relação custo-benefício.
O OpenAI e a Microsoft estão investigando se a Deepseek violou os Termos de Serviço da OpenAI usando sua API ou empregando "destilação", uma técnica que extrai dados de modelos maiores para treinamento. O OpenAI reconhece as tentativas em andamento dos chineses e de outras empresas de replicar os modelos de IA liderados e enfatiza seu compromisso de proteger sua propriedade intelectual (IP) por meio de várias contramedidas e colaboração com o governo dos EUA.
David Sacks, Czar de AI do presidente Trump, apóia a alegação de que a Deepseek usou os modelos do OpenAI, sugerindo que as principais empresas de IA implementarão medidas para evitar ocorrências semelhantes.
Esta situação destaca a ironia das acusações do Openai, dadas as alegações anteriores de que a criação de modelos de IA como o ChatGPT é impossível sem usar material protegido por direitos autorais. Openai argumentou anteriormente à Câmara dos Lordes do Reino Unido que as leis de direitos autorais tornam impossível treinar os principais modelos de IA sem acesso ao trabalho protegido por direitos autorais. Essa postura é ainda mais complicada por processos movidos contra o OpenAI pelo New York Times e 17 autores alegando violação de direitos autorais. O OpenAI sustenta que suas práticas de treinamento constituem "uso justo". O cenário legal em torno dos dados de treinamento da IA e direitos autorais permanece altamente contestado, particularmente à luz de um escritório de direitos autorais dos EUA em 2018, decidindo que a arte gerada pela IA não é de direitos autorais.