NOSSAS REDES

MUNDO

OpenAI training data ‘contains millions’ of NYT and Daily News works

PUBLICADO

em

Millions of stories published by sites including The New York Times and The New York Daily News have been found in three weeks of searching OpenAI’s training dataset.

The news publishers are currently trawling through data to find instances of their copyrighted work being used to train OpenAI’s models – but they say the tech company should be forced to provide the information itself.

They are now asking for a court order requiring OpenAI to “identify and admit” which of their copyrighted content was used to train each of its large language models between GPT-1 and GPT-4o.

According to the ChatGPT creator, which objected to the request, the publishers have asked for information about almost 20 million pieces of content mentioned in the case, “effectively resulting in almost 500 million requests”.

The publishers told the court on Friday that their requests to the AI company for help with inspecting the data “would be significantly reduced if OpenAI admitted that they trained their models on all, or the vast majority, of News Plaintiffs’ copyrighted content”.


A letter to the court also stated: “While they have already found millions of News Plaintiffs’ works in the training datasets, they do not know how many more works are yet to be uncovered – information that OpenAI, as the party that chose to copy these works, should be ordered to provide.”

The New York Times was the first major news publisher to file a copyright case against OpenAI and its partner Microsoft in December last year.

The New York Daily News and seven sister publications, all owned by Alden Global Capital, followed suit in April and the two cases have since been combined after OpenAI and Microsoft argued they “involve nearly identical allegations relating to the same new technology”.

In the new letter, the news publishers argued that identifying which of their copyrighted work was taken and used to train the GPT models is “foundational to these cases and informs the scope” of their claims.

“But News Plaintiffs and OpenAI have a fundamental disagreement about who is responsible for identifying this information.”

The publishers said they have served numerous requests since February for information about what’s in OpenAI’s training datasets, to which the tech company replied: “OpenAI will make available for inspection, pursuant to an inspection protocol to be negotiated between the parties, the pretraining data for models used for ChatGPT that it locates after a reasonable search.”

After long-running negotiations, since last month the news publishers have been inspecting OpenAI’s training data under strict conditions, previously described by the court as a “sandbox” (meaning a highly controlled environment in which only certain applications can be run).

But the news publishers said they initially faced “severe and repeated technical issues” stopping them from being able to “effectively and efficiently” carry out the search and “ascertain the full scope of OpenAI’s infringement”.

They complained that the process is “time-consuming, burdensome, and hugely expensive” and said they had spent the equivalent of 27 days via lawyers and experts in the OpenAI sandbox but were “nowhere near done”.

The New York Times Company results published on Monday revealed it has so far spent at least $7.6m on the case against OpenAI and Microsoft.

OpenAI: Training data searches are ‘uncharted waters’

OpenAI responded within the same letter that the publishers’ complaints about the inspection have either been resolved or are being actively discussed. It blamed the issues on consultants for the publishers “overwhelming the file system with malformed searches”.

OpenAI added: “Taking a step back, everyone agrees the parties are navigating uncharted waters with training-data discovery.

“There are no precedents for such discovery, where Plaintiffs seek access to several hundred terabytes of unstructured textual data. OpenAI cannot easily identify the specific content that Plaintiffs are interested in, so it did exactly what Rule 34 allows: it invited Plaintiffs to inspect the data as it is kept in the ordinary course. There is no ‘sandbox’. Rather, because the data is far too voluminous to produce, OpenAI built the hardware and software that Plaintiffs need to inspect.

“Specifically, OpenAI organised hundreds of terabytes of training data in an object-storage file system for Plaintiffs’ exclusive use; it built an enterprise-grade virtual machine with the computing power to access, search, and analyse the datasets; it installed hundreds of software tools and tens of gigabytes of Plaintiffs’ data upon their request; and it managed the necessary firewalls and secure virtual private network to support the inspection.”

OpenAI said it would continue to help the publishers overcome technical challenges provided they “engage in good faith” but added: “Unfortunately, this has not always been the case,” accusing them of delaying the process for months and submitting “hundreds of irrelevant requests”.

Representatives for the Authors Guild and progressive newsbrand Raw Story Media have also viewed the OpenAI training data for their own cases.

OpenAI previously asked a judge to force The New York Times to hand over its journalists’ confidential notes, a move the publisher warned would have “serious negative and far-reaching consequences” and was ultimately denied in September.

Email pged@pressgazette.co.uk to point out mistakes, provide story tips or send in a letter for publication on our “Letters Page” blog

Leia Mais

Advertisement
Comentários

Warning: Undefined variable $user_ID in /home/u824415267/domains/acre.com.br/public_html/wp-content/themes/zox-news/comments.php on line 48

You must be logged in to post a comment Login

Comente aqui

MUNDO

SUS vai distribuir vacina contra herpes-zóster, afirma ministro da Saúde; vídeo

PUBLICADO

em

São 7 os próximos feriados de 2025. Três vão cair em plena quinta-feira. - Foto: Freepik

Em breve, os brasileiros poderão se imunizar de graça contra uma doença silenciosa, muito dolorida, que atinge principalmente, quem tem mais de 50 anos. O SUS (Sistema Único de Saúde) vai incluir a vacina contra herpes-zóster na lista de prioridades. A notícia boa foi dada esta semana pelo Ministro da Saúde, Alexandre Padilha.

Atualmente, a vacina é oferecida apenas nas unidades privadas – em duas doses –  e custa, em média, R$ 800. O pedido para a inclusão da vacina foi feito diretamente ao ministro durante audiência na Comissão de Saúde na Câmara, por uma deputada que teve a doença.

“É uma prioridade nossa, enquanto ministro da Saúde, que essa vacina possa estar no Sistema Único de Saúde. A gente pode fazer grandes campanhas de vacinação para as pessoas que têm indicação de receber essa vacina. Pode contar conosco”, afirmou Padilha.

Experiência dolorosa pessoal

O apelo partiu da deputada federal Adriana Accorsi (PT-GO), que ficou cinco dias internada em Goiânia, por uma crise causada pelo vírus que provoca herpes-zóster. Com dores pelo corpo, sentindo a pele queimar, ela disse que foi uma experiência muito dolorosa.

“Passei por essa doença recentemente e senti na pele o quanto ela é dolorosa, perigosa e pode deixar sequelas graves. Por isso, sei o quanto é fundamental garantir acesso à prevenção e à informação, especialmente para quem mais precisa”, afirmou a parlamentar.

As sequelas mais graves da doença podem provocar lesões na pele, cegueira, surdez e paralisia cerebral, por exemplo. Estudos indicam que os casos aumentaram 35% após a pandemia de Covid-19

Leia mais notícia boa

A doença herpes-zóster

Só em 2023, mais de 2,6 mil pessoas foram internadas com o diagnóstico da doença no Brasil.

O herpes- zóster, chamado popularmente como “cobreiro”, é infeccioso. A doença é causada pelo vírus varicela-zóster, o mesmo que causa a catapora.

A crise gera erupções na pele, febre, mal-estar e dor intensa fortes nos nervos.

Em geral as pessoas com baixa imunidade estão mais propensas.

Vai SUS!

A vacina contra herpes-zóster deve ser incluída na lista de prioridades, de acordo com o ministro Alexandre Padilha. Foto: Ministério da Saúde A vacina contra herpes-zóster deve ser incluída na lista de prioridades, de acordo com o ministro Alexandre Padilha. Foto: Ministério da Saúde

A promessa do ministro da Saúde, Alexandre Padilha, foi registrada:



Leia Mais: Só Notícias Boas

Continue lendo

MUNDO

Anvisa aprova medicamento que pode retardar Alzheimer

PUBLICADO

em

São 7 os próximos feriados de 2025. Três vão cair em plena quinta-feira. - Foto: Freepik

Anvisa aprovou o Kinsula, primeiro medicamento que pode retardar a progressão do Alzheimer. Já provado nos EUA, ele é da farmacêutica Eli Lilly. – Foto: Marcelo Camargo/Agência Brasil

Uma notícia boa para renovar a esperança de milhares de brasileiros. A Agência Nacional de Vigilância Sanitária (Anvisa) aprovou um novo medicamento internacional para tratar o Alzheimer.

Indicado para o estágio inicial da doença, o Kisunla (donanemabe) é fruto de mais de três décadas de pesquisa. Em testes, o medicamento retardou em até 35% o avanço da doença em pacientes com sintomas leves.

Desenvolvido pela farmacêutica Eli Lilly, o donanemabe foi aprovado nos Estados Unidos em julho de 2024. No Brasil, a aprovação foi divulgada nesta terça-feira (22). O Kisunla é injetável e deve ser administrado uma vez por mês.

Como funciona

A principal função do fármaco é remover as chamadas placas amiloides, os acúmulos anormais de proteínas no cérebro.

São esses acúmulos que atrapalham a comunicação entre os neurônios e estão associados ao surgimento e à progressão da doença.

Nos testes clínicos, o remédio conseguiu eliminar até 75% das placas após 18 meses de tratamento.

Leia mais notícia boa

Quem se beneficia

O tratamento é indicado apenas para pacientes com comprometimento cognitivo leve e demência leve.

Por outro lado, o Kisunla não é recomendado para quem usa anticoagulantes ou sofre de uma condição chamada angiopatia amiloide cerebral.

Também há restrições para pacientes que não possuem uma variante específica do gene ApoE ε4.

Em comunicado à imprensa, Luiz Magno, diretor médico sênior da Lilly do Brasil, comemorou a aprovação pela Anvisa:

“Estamos vivendo um momento único na história da neurociência. Depois de mais de trinta e cinco anos de pesquisa da Lilly, finalmente temos o primeiro tratamento que modifica a história natural da doença de Alzheimer aprovado no Brasil. Claro, esse é um marco para nós como companhia e para a ciência, mas principalmente para as pessoas que vivem com a doença de Alzheimer e seus familiares – que há anos buscam por mais esperança. Essa é nossa missão, transformar vidas.”

Estudo clínico

A avaliação para a aprovação foi feita a partir de um estudo clínico de 2023. Ao todo, a pesquisa envolveu 1.736 pacientes de 8 países com Alzheimer em estágio inicial.

Aqueles que receberam o Kisunla tiveram uma progressão clínica da doença menor em comparação aos pacientes tratados com o placebo.

Segundo a Anvisa, assim como qualquer outro remédio, o medicamento vai continuar sendo monitorado.

Disponível em breve

Apesar da aprovação, o Kisunla ainda não está disponível nas farmácias.

Para isso, é preciso esperar o medicamento passar pela Câmara de Regulação do Mercado de Medicamentos (CMED).

O processo pode levar semanas ou até meses.

Nos Estados Unidos, o tratamento com o fármaco custa por volta de US$ 12.522 por 6 meses e US$32.000 por 12 meses, aproximadamente R$ 183.192 na cotação atual.

O medicamento é injetável e deve ser administrado uma vez por mês. - Foto: Getty Images/Science Photo Libra

O medicamento é injetável e deve ser administrado uma vez por mês. – Foto: Getty Images/Science Photo Libra



Leia Mais: Só Notícias Boas

Continue lendo

MUNDO

China lança banda larga 10G; a primeira e mais rápida do mundo

PUBLICADO

em

São 7 os próximos feriados de 2025. Três vão cair em plena quinta-feira. - Foto: Freepik

Na vanguarda sempre, os chineses surpreendem mais uma vez. A China lança a primeira banda larga 10G do mundo. A expectativa é oferecer velocidades de download de até 9.834 Mbps, velocidades de upload de 1.008 Mbps e latência de 3 milissegundos, muito maiores do que as usadas atualmente.

Com o 10G vai ser possível baixar em apenas 20 segundos um filme completo em 4K (com cerca de 20 GB), que normalmente leva de 7 a 10 minutos em uma conexão de 1 Gbps.

A tecnologia de Rede Óptica Passiva (PON) 50G, que abastece a rede 10G, melhora a transmissão de dados pela infraestrutura – de fibra óptica atual.

Trabalho em parceria

A inovação foi anunciada, no Condado de Sunan, província de Hebei. O lançamento é resultado de um trabalho colaborativo da Huawei e da China Unicom.

Essa tecnologia permitirá, por exemplo, o uso de nuvem, realidade virtual e aumentada, streaming de vídeo 8K e integração de dispositivos domésticos inteligentes, tudo de uma só vez.

Com essa iniciativa, a China supera a banda larga comercial em países, como Emirados Árabes e Catar, de acordo com o Times of India.

Leia mais notícia boa

Expectativas de aplicações sociais

A implementação da banda larga 10G deve facilitar avanços em setores sociais, como saúde, educação e agricultura por intermédio da transmissão de dados mais rápida e confiável.

De acordo com os engenheiros e pesquisadores envolvidos, essa tecnologia será usada em aplicados “exigentes” de alta velocidade.

Com a banda larga 10G, a China se coloca à frente dos Emirados Árabes e do Catar em tecnologia comercial. Foto: Freepik Com a banda larga 10G, a China se coloca à frente dos Emirados Árabes e do Catar em tecnologia comercial. Foto: Freepik



Leia Mais: Só Notícias Boas

Continue lendo

MAIS LIDAS