NOSSAS REDES

ACRE

OpenAI training data ‘contains millions’ of NYT and Daily News works

PUBLICADO

em

Millions of stories published by sites including The New York Times and The New York Daily News have been found in three weeks of searching OpenAI’s training dataset.

The news publishers are currently trawling through data to find instances of their copyrighted work being used to train OpenAI’s models – but they say the tech company should be forced to provide the information itself.

They are now asking for a court order requiring OpenAI to “identify and admit” which of their copyrighted content was used to train each of its large language models between GPT-1 and GPT-4o.

According to the ChatGPT creator, which objected to the request, the publishers have asked for information about almost 20 million pieces of content mentioned in the case, “effectively resulting in almost 500 million requests”.

The publishers told the court on Friday that their requests to the AI company for help with inspecting the data “would be significantly reduced if OpenAI admitted that they trained their models on all, or the vast majority, of News Plaintiffs’ copyrighted content”.


A letter to the court also stated: “While they have already found millions of News Plaintiffs’ works in the training datasets, they do not know how many more works are yet to be uncovered – information that OpenAI, as the party that chose to copy these works, should be ordered to provide.”

The New York Times was the first major news publisher to file a copyright case against OpenAI and its partner Microsoft in December last year.

The New York Daily News and seven sister publications, all owned by Alden Global Capital, followed suit in April and the two cases have since been combined after OpenAI and Microsoft argued they “involve nearly identical allegations relating to the same new technology”.

In the new letter, the news publishers argued that identifying which of their copyrighted work was taken and used to train the GPT models is “foundational to these cases and informs the scope” of their claims.

“But News Plaintiffs and OpenAI have a fundamental disagreement about who is responsible for identifying this information.”

The publishers said they have served numerous requests since February for information about what’s in OpenAI’s training datasets, to which the tech company replied: “OpenAI will make available for inspection, pursuant to an inspection protocol to be negotiated between the parties, the pretraining data for models used for ChatGPT that it locates after a reasonable search.”

After long-running negotiations, since last month the news publishers have been inspecting OpenAI’s training data under strict conditions, previously described by the court as a “sandbox” (meaning a highly controlled environment in which only certain applications can be run).

But the news publishers said they initially faced “severe and repeated technical issues” stopping them from being able to “effectively and efficiently” carry out the search and “ascertain the full scope of OpenAI’s infringement”.

They complained that the process is “time-consuming, burdensome, and hugely expensive” and said they had spent the equivalent of 27 days via lawyers and experts in the OpenAI sandbox but were “nowhere near done”.

The New York Times Company results published on Monday revealed it has so far spent at least $7.6m on the case against OpenAI and Microsoft.

OpenAI: Training data searches are ‘uncharted waters’

OpenAI responded within the same letter that the publishers’ complaints about the inspection have either been resolved or are being actively discussed. It blamed the issues on consultants for the publishers “overwhelming the file system with malformed searches”.

OpenAI added: “Taking a step back, everyone agrees the parties are navigating uncharted waters with training-data discovery.

“There are no precedents for such discovery, where Plaintiffs seek access to several hundred terabytes of unstructured textual data. OpenAI cannot easily identify the specific content that Plaintiffs are interested in, so it did exactly what Rule 34 allows: it invited Plaintiffs to inspect the data as it is kept in the ordinary course. There is no ‘sandbox’. Rather, because the data is far too voluminous to produce, OpenAI built the hardware and software that Plaintiffs need to inspect.

“Specifically, OpenAI organised hundreds of terabytes of training data in an object-storage file system for Plaintiffs’ exclusive use; it built an enterprise-grade virtual machine with the computing power to access, search, and analyse the datasets; it installed hundreds of software tools and tens of gigabytes of Plaintiffs’ data upon their request; and it managed the necessary firewalls and secure virtual private network to support the inspection.”

OpenAI said it would continue to help the publishers overcome technical challenges provided they “engage in good faith” but added: “Unfortunately, this has not always been the case,” accusing them of delaying the process for months and submitting “hundreds of irrelevant requests”.

Representatives for the Authors Guild and progressive newsbrand Raw Story Media have also viewed the OpenAI training data for their own cases.

OpenAI previously asked a judge to force The New York Times to hand over its journalists’ confidential notes, a move the publisher warned would have “serious negative and far-reaching consequences” and was ultimately denied in September.

Email pged@pressgazette.co.uk to point out mistakes, provide story tips or send in a letter for publication on our “Letters Page” blog

Leia Mais

Advertisement
Comentários

Warning: Undefined variable $user_ID in /home/u824415267/domains/acre.com.br/public_html/wp-content/themes/zox-news/comments.php on line 48

You must be logged in to post a comment Login

Comente aqui

ACRE

Aperfeiçoamento em cuidado pré-natal é encerrado na Ufac — Universidade Federal do Acre

PUBLICADO

em

Aperfeiçoamento em cuidado pré-natal é encerrado na Ufac — Universidade Federal do Acre

A Ufac realizou o encerramento do curso de aperfeiçoamento em cuidado pré-natal na atenção primária à saúde, promovido pela Pró-Reitoria de Extensão e Cultura (Proex), Secretaria de Estado de Saúde do Acre (Sesacre) e Secretaria Municipal de Saúde de Rio Branco (Semsa). O evento, que ocorreu nessa terça-feira, 11, no auditório do E-Amazônia, campus-sede, marcou também a primeira mostra de planos de intervenção que se transformaram em ações no território, intitulada “O Cuidar que Floresce”.

Com carga horária de 180 horas, o curso qualificou 70 enfermeiros da rede municipal de saúde de Rio Branco, com foco na atualização das práticas de cuidado pré-natal e na ampliação da atenção às gestantes de risco habitual. A formação teve início em março e foi conduzida em formato modular, utilizando metodologias ativas de aprendizagem.

Representando a reitora da Ufac, Guida Aquino, o diretor de Ações de Extensão da Proex, Gilvan Martins, destacou o papel social da universidade na formação continuada dos profissionais de saúde. “Cada cursista leva consigo o conhecimento científico que foi compartilhado aqui. Esse é o compromisso da Ufac: transformar o saber em ação, alcançando as comunidades e contribuindo para a melhoria da assistência às mulheres atendidas nas unidades.” 

A coordenadora do curso, professora Clisângela Lago Santos, explicou que a iniciativa nasceu de uma demanda da Sesacre e foi planejada de forma inovadora. “Percebemos que o modelo tradicional já não surtia o efeito esperado. Por isso, pensamos em um formato diferente, com módulos e metodologias ativas. Foi a nossa primeira experiência nesse formato e o resultado foi muito positivo.”

Para ela, a formação representa um esforço conjunto. “Esse curso só foi possível com o envolvimento de professores, residentes e estudantes da graduação, além do apoio da Rede Alyne e da Sesacre”, disse. “Hoje é um dia de celebração, porque quem vai sentir os resultados desse trabalho são as gestantes atendidas nos territórios.” 

Representando o secretário municipal de Saúde, Rennan Biths, a diretora de Políticas de Saúde da Semsa, Jocelene Soares, destacou o impacto da qualificação na rotina dos profissionais. “Esse curso veio para aprimorar os conhecimentos de quem está na ponta, nas unidades de saúde da família. Sei da dedicação de cada enfermeiro e fico feliz em ver que a qualidade do curso está se refletindo no atendimento às nossas gestantes.”

A programação do encerramento contou com uma mostra cultural intitulada “O Impacto da Formação na Prática dos Enfermeiros”, que reuniu relatos e produções dos participantes sobre as transformações promovidas pelo curso em suas rotinas de trabalho. Em seguida, foi realizada uma exposição de banners com os planos de intervenção desenvolvidos pelos cursistas, apresentando as ações implementadas nos territórios de saúde. 

Também participaram do evento o coordenador da Rede Alyne, Walber Carvalho, representando a Sesacre; a enfermeira cursista Narjara Campos; além de docentes e residentes da área de saúde da mulher da Ufac.

 



Leia Mais: UFAC

Continue lendo

ACRE

CAp promove minimaratona com alunos, professores e comunidade — Universidade Federal do Acre

PUBLICADO

em

CAp promove minimaratona com alunos, professores e comunidade — Universidade Federal do Acre

O Colégio de Aplicação (CAp) da Ufac realizou uma minimaratona com participação de estudantes, professores, técnico-administrativos, familiares e ex-alunos. A atividade é um projeto de extensão pedagógico interdisciplinar, chamado Maracap, que está em sua 11ª edição. Reunindo mais de 800 pessoas, o evento ocorreu em 25 de outubro, no campus-sede da Ufac.

Idealizado e coordenado pela professora de Educação Física e vice-diretora do CAp, Alessandra Lima Peres de Oliveira, o projeto promove a saúde física e social no ambiente estudantil, com caráter competitivo e formativo, integrando diferentes áreas do conhecimento e estimulando o espírito esportivo e o convívio entre gerações. A minimaratona envolve alunos dos ensinos fundamental e médio, do 6º ano à 3ª série, com classificação para o 1º, 2º e 3º lugar em cada categoria. 

“O Maracap é muito mais do que uma corrida. Ele representa a união da nossa comunidade em torno de valores como disciplina, cooperação e respeito”, disse Alessandra. “É também uma proposta de pedagogia de inclusão do esporte no currículo escolar, que desperta nos estudantes o prazer pela prática esportiva e pela vida saudável.”

O pró-reitor de Extensão e Cultura, Carlos Paula de Moraes, ressaltou a importância do projeto como uma ação de extensão universitária que conecta a Ufac à sociedade. “Projetos como o Maracap mostram como a extensão universitária cumpre seu papel de integrar a universidade à comunidade. O Colégio de Aplicação é um espaço de formação integral e o esporte é uma poderosa ferramenta para o desenvolvimento humano, social e educacional.”

 



Leia Mais: UFAC

Continue lendo

ACRE

Semana de Letras/Português da Ufac tematiza ‘língua pretuguesa’ — Universidade Federal do Acre

PUBLICADO

em

Semana de Letras/Português da Ufac tematiza ‘língua pretuguesa’ — Universidade Federal do Acre

O curso e o Centro Acadêmico de Letras/Português da Ufac iniciaram, nessa segunda-feira, 10, no anfiteatro Garibaldi Brasil, sua 24ª Semana Acadêmica, com o tema “Minha Pátria é a Língua Pretuguesa”. O evento é dedicado à reflexão sobre memória, decolonialidade e as relações históricas entre o Brasil e as demais nações de língua portuguesa. A programação segue até sexta-feira, 14, com mesas-redondas, intervenções artísticas, conferências, minicursos, oficinas e comunicações orais.

Na abertura, o coordenador da semana acadêmica, Henrique Silvestre Soares, destacou a necessidade de ligar a celebração da língua às lutas históricas por soberania e justiça social. Segundo ele, é importante que, ao celebrar a Semana de Letras e a independência dos países africanos, se lembre também que esses países continuam, assim como o Brasil, subjugados à força de imperialismos que conduzem à pobreza, à violência e aos preconceitos que ainda persistem.

O pró-reitor de Extensão e Cultura, Carlos Paula de Moraes, salientou o compromisso ético da educação e reforçou que a universidade deve assumir uma postura crítica diante da realidade. “A educação não é imparcial. É preciso, sim, refletir sobre essas questões, é preciso, sim, assumir o lado da história.”

A pró-reitora de Graduação, Ednaceli Damasceno, ressaltou a força do tema proposto. Para ela, o assunto é precioso por levar uma mensagem forte sobre o papel da universidade na sociedade. “Na própria abertura dos eventos na faculdade, percebemos o que ocorre ao nosso redor e que não podemos mais tratar como aula generalizada ou naturalizada”, observou.

O diretor do Centro de Educação, Letras e Artes (Cela), Selmo Azevedo Pontes, reafirmou a urgência do debate proposto pela semana. Ele lembrou que, no Brasil, as universidades estiveram, durante muitos anos, atreladas a um projeto hegemônico. “Diziam que não era mais urgente nem necessário, mas é urgente e necessário.”

Também estiveram presentes na cerimônia de abertura o vice-reitor, Josimar Batista Ferreira; o coordenador de Letras/Português, Sérgio da Silva Santos; a presidente do Cela, Thaís de Souza; e a professora do Laboratório de Letras, Jeissyane Furtado da Silva.

(Camila Barbosa, estagiária Ascom/Ufac)

 

//www.instagram.com/embed.js



Leia Mais: UFAC

Continue lendo

MAIS LIDAS