{"id":11037,"date":"2024-04-17T07:44:01","date_gmt":"2024-04-17T10:44:01","guid":{"rendered":"https:\/\/minutobahia24h.com.br\/?p=11037"},"modified":"2024-04-17T07:44:02","modified_gmt":"2024-04-17T10:44:02","slug":"ia-vai-acabar-dados-para-treinar-softwares-podem-esgotar-em-2026-entenda","status":"publish","type":"post","link":"https:\/\/minutobahia24h.com.br\/?p=11037","title":{"rendered":"IA vai acabar? Dados para treinar softwares podem esgotar em 2026; entenda"},"content":{"rendered":"\n<p>Dados utilizados para treinar modelos de\u00a0<a class=\"\" href=\"https:\/\/www.techtudo.com.br\/softwares\/apps\/inteligencia-artificial\/\">intelig\u00eancia artificial (IA)<\/a>\u00a0est\u00e3o se tornando cada vez mais escassos. Pelo menos \u00e9 o que diz um estudo realizado por um grupo de institui\u00e7\u00f5es, incluindo a Epoch, Universidade de Aberdeen, MIT e Universidade de T\u00fcbingen, que alerta que esses recursos devem se esgotar at\u00e9 2026. Al\u00e9m disso, dados lingu\u00edsticos e de imagem de alta qualidade podem seguir o mesmo caminho entre 2030 e 2060. As previs\u00f5es levantam quest\u00f5es sobre o futuro da IA e o seu desempenho a favor da humanidade.<\/p>\n\n\n\n<p>A falta de dados de alta qualidade pode prejudicar o desenvolvimento de novas tecnologias, limitar a capacidade de aprendizado das ferramentas e levar \u00e0 piora de desempenho em tarefas como tradu\u00e7\u00e3o autom\u00e1tica, reconhecimento de fala e gera\u00e7\u00e3o de texto. Esse cen\u00e1rio pode ter implica\u00e7\u00f5es em \u00e1reas vitais como sa\u00fade, educa\u00e7\u00e3o e finan\u00e7as, que cada vez mais dependem da IA para operar de forma eficiente. A seguir, entenda por que os dados de alta qualidade s\u00e3o importantes para o desenvolvimento das IAs e saiba se essas plataformas podem acabar em um futuro pr\u00f3ximo.<\/p>\n\n\n<div class=\"wp-block-image\">\n<figure class=\"aligncenter size-full\"><img data-recalc-dims=\"1\" fetchpriority=\"high\" decoding=\"async\" width=\"800\" height=\"450\" src=\"https:\/\/i0.wp.com\/minutobahia24h.com.br\/wp-content\/uploads\/2024\/04\/Sem-titulo-195.jpg?resize=800%2C450&#038;ssl=1\" alt=\"\" class=\"wp-image-11038\" srcset=\"https:\/\/i0.wp.com\/minutobahia24h.com.br\/wp-content\/uploads\/2024\/04\/Sem-titulo-195.jpg?w=1000&amp;ssl=1 1000w, https:\/\/i0.wp.com\/minutobahia24h.com.br\/wp-content\/uploads\/2024\/04\/Sem-titulo-195.jpg?resize=300%2C169&amp;ssl=1 300w, https:\/\/i0.wp.com\/minutobahia24h.com.br\/wp-content\/uploads\/2024\/04\/Sem-titulo-195.jpg?resize=768%2C432&amp;ssl=1 768w, https:\/\/i0.wp.com\/minutobahia24h.com.br\/wp-content\/uploads\/2024\/04\/Sem-titulo-195.jpg?resize=750%2C422&amp;ssl=1 750w\" sizes=\"(max-width: 800px) 100vw, 800px\" \/><figcaption class=\"wp-element-caption\">Dados qualificados para aprendizado de IAs podem se esgotar em breve; saiba mais \u2014 Foto: Reprodu\u00e7\u00e3o\/Canva<br><\/figcaption><\/figure>\n<\/div>\n\n\n<h2 class=\"wp-block-heading\">O que diz a pesquisa sobre dados para treinar IAs?<\/h2>\n\n\n\n<figure class=\"wp-block-image\"><img data-recalc-dims=\"1\" decoding=\"async\" src=\"https:\/\/i0.wp.com\/s2-techtudo.glbimg.com\/uopzn0PpFJPj_qLOjs8Qq__ZwbA%3D\/0x0%3A1920x1080\/984x0\/smart\/filters%3Astrip_icc%28%29\/i.s3.glbimg.com\/v1\/AUTH_08fbf48bc0524877943fe86e43087e7a\/internal_photos\/bs\/2024\/n\/f\/ZlYxoITdSNvUBHDKv3qA\/mapa-mental-com-brainstorm-escrito-a-mao-colorido-13-.png?w=800&#038;ssl=1\" alt=\"Gr\u00e1fico da pesquisa mostra a distribui\u00e7\u00e3o das datas de esgotamento da disponibilidade e da tend\u00eancia de consumo de dados \u2014 Foto: Reprodu\u00e7\u00e3o\/J\u00falia Silveira\"\/><figcaption class=\"wp-element-caption\">Gr\u00e1fico da pesquisa mostra a distribui\u00e7\u00e3o das datas de esgotamento da disponibilidade e da tend\u00eancia de consumo de dados \u2014 Foto: Reprodu\u00e7\u00e3o\/J\u00falia Silveira<\/figcaption><\/figure>\n\n\n\n<p>O estudo destaca que a qualidade dos dados \u00e9 fundamental para o sucesso de qualquer modelo de IA. Dados precisos, relevantes, \u00e9ticos e adequados s\u00e3o essenciais para treinar modelos robustos e confi\u00e1veis. No entanto, a coleta e a curadoria exigem tempo e recursos consider\u00e1veis, o que torna essa tarefa cada vez mais desafiadora.<\/p>\n\n\n\n<p>Al\u00e9m disso, o documento aborda a previs\u00e3o de esgotamento dos dados de alta qualidade para treinamento de modelos de linguagem em um futuro pr\u00f3ximo, destacando a necessidade de considerar a efici\u00eancia dos dados e a busca por novas fontes para sustentar o progresso cont\u00ednuo. A an\u00e1lise tamb\u00e9m aponta para a import\u00e2ncia de desenvolver m\u00e9tricas autom\u00e1ticas robustas, melhorando a qualidade dos conjuntos de dados utilizados nos modelos de IA.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Por que os dados de alta qualidade s\u00e3o importantes para a intelig\u00eancia artificial?<\/h2>\n\n\n\n<p>Os dados s\u00e3o a mat\u00e9ria-prima que alimenta e molda os sistemas de IA. A utiliza\u00e7\u00e3o de informa\u00e7\u00f5es de alta qualidade durante o treinamento dessas plataformas \u00e9 essencial para assegurar a precis\u00e3o e a confiabilidade das previs\u00f5es e respostas geradas. Dados precisos capacitam as ferramentas a oferecer respostas corretas e previs\u00f5es assertivas, diminuindo o risco de<a class=\"\" href=\"https:\/\/www.techtudo.com.br\/guia\/2023\/09\/inteligencias-artificiais-podem-mentir-para-voce-veja-por-que-e-como-evitar-edsoftwares.ghtml\">&nbsp;&#8220;alucina\u00e7\u00f5es&#8221;<\/a>.<\/p>\n\n\n\n<p>Quando abastecidas com informa\u00e7\u00f5es confi\u00e1veis, as IAs se tornam mais abrangentes, vers\u00e1teis e assertivas em diversos contextos. A qualidade das informa\u00e7\u00f5es aprendidas tamb\u00e9m influencia na capacidade da intelig\u00eancia artificial de aplicar seus conhecimentos em novas situa\u00e7\u00f5es, principalmente em aplica\u00e7\u00f5es cr\u00edticas, como na \u00e1rea da sa\u00fade ou seguran\u00e7a, por exemplo.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img data-recalc-dims=\"1\" decoding=\"async\" src=\"https:\/\/i0.wp.com\/s2-techtudo.glbimg.com\/7caI24xer8tSdhs4t-cmXja_Iws%3D\/0x0%3A2500x1667\/984x0\/smart\/filters%3Astrip_icc%28%29\/i.s3.glbimg.com\/v1\/AUTH_08fbf48bc0524877943fe86e43087e7a\/internal_photos\/bs\/2024\/B\/N\/AvaMGISUu2qY3V53Q7rA\/tecnologia-0050.jpg?w=800&#038;ssl=1\" alt=\"Dados de qualidade s\u00e3o fundamentais para o aprendizado e treinamento de modelos de IA \u2014 Foto: Reprodu\u00e7\u00e3o\/Roberto Dziura Jr\/AEN\"\/><figcaption class=\"wp-element-caption\">Dados de qualidade s\u00e3o fundamentais para o aprendizado e treinamento de modelos de IA \u2014 Foto: Reprodu\u00e7\u00e3o\/Roberto Dziura Jr\/AEN<\/figcaption><\/figure>\n\n\n\n<p>Al\u00e9m da precis\u00e3o e confiabilidade, os dados utilizados no treinamento de IAs tamb\u00e9m devem ser seguros, n\u00e3o contendo informa\u00e7\u00f5es sens\u00edveis, como dados pessoais ou financeiros. Garantir a \u00e9tica e a seguran\u00e7a dos dados tamb\u00e9m ajuda a evitar que os modelos reproduzam preconceitos ou informa\u00e7\u00f5es sens\u00edveis que possam prejudicar ou ofender indiv\u00edduos e grupos. Foi o que aconteceu, por exemplo, com o&nbsp;<a class=\"\" href=\"https:\/\/www.techtudo.com.br\/tudo-sobre\/gemini-google\">Gemini Google<\/a>, que teve que pausar a gera\u00e7\u00e3o de imagens recentemente, ap\u00f3s<a class=\"\" href=\"https:\/\/www.techtudo.com.br\/noticias\/2024\/02\/por-que-imagens-do-gemini-tem-inconsistencias-historicas-entenda-falhas-edsoftwares.ghtml\">&nbsp;produzir representa\u00e7\u00f5es hist\u00f3ricas equivocadas<\/a>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">\u00c9 o fim dos modelos de intelig\u00eancia artificial?<\/h2>\n\n\n\n<p>O futuro da IA pode parecer complexo diante dos desafios, como a escassez de dados e a dissemina\u00e7\u00e3o de informa\u00e7\u00f5es enviesadas. Mas isso n\u00e3o significa que essa tecnologia vai acabar. O progresso na pesquisa e na inova\u00e7\u00e3o continua impulsionando o desenvolvimento de novas t\u00e9cnicas de treinamento que contornam obst\u00e1culos como esses. A a\u00e7\u00e3o colaborativa entre governos e institui\u00e7\u00f5es de pesquisa pode ser a chave para encontrar solu\u00e7\u00f5es. Isso inclui a cria\u00e7\u00e3o de incentivos para compartilhamento de informa\u00e7\u00f5es e o investimento em pesquisas voltadas para o aprimoramento da efici\u00eancia dos modelos de IA.<\/p>\n\n\n\n<p>Uma possibilidade promissora \u00e9 a melhoria dos algoritmos pelos desenvolvedores de IA, possibilitando o uso mais eficiente dos dados dispon\u00edveis. No futuro, \u00e9 poss\u00edvel que os modelos sejam treinados com menos dados, o que n\u00e3o apenas impulsionaria a efici\u00eancia da IA, mas tamb\u00e9m contribuiria para a redu\u00e7\u00e3o do impacto ambiental gerado por essa ind\u00fastria. Al\u00e9m disso, h\u00e1 um excesso de conte\u00fados para al\u00e9m do espa\u00e7o online gratuito que poderiam ser explorados. Material de grandes editoras e reposit\u00f3rios offline representam uma fonte potencialmente valiosa de aprendizado.<\/p>\n\n\n\n<figure class=\"wp-block-image\"><img data-recalc-dims=\"1\" decoding=\"async\" src=\"https:\/\/i0.wp.com\/s2-techtudo.glbimg.com\/uPHqnRc791iqEZOysJYml2Wf7Ic%3D\/0x0%3A1920x1080\/984x0\/smart\/filters%3Astrip_icc%28%29\/i.s3.glbimg.com\/v1\/AUTH_08fbf48bc0524877943fe86e43087e7a\/internal_photos\/bs\/2024\/K\/x\/jX2S0uRfaoRZ1hwPKPBA\/mapa-mental-com-brainstorm-escrito-a-mao-colorido-14-.png?w=800&#038;ssl=1\" alt=\"Dados sint\u00e9ticos podem ser uma alternativa diante da escassez de informa\u00e7\u00f5es para treinamento de IAs \u2014 Foto: Reprodu\u00e7\u00e3o\/Canva\"\/><figcaption class=\"wp-element-caption\">Dados sint\u00e9ticos podem ser uma alternativa diante da escassez de informa\u00e7\u00f5es para treinamento de IAs \u2014 Foto: Reprodu\u00e7\u00e3o\/Canva<\/figcaption><\/figure>\n\n\n\n<p>Conte\u00fados digitais protegidos por acesso pago tamb\u00e9m podem ser disponibilizados futuramente. Um exemplo recente \u00e9 a iniciativa da News Corp, uma das maiores propriet\u00e1rias de conte\u00fado de not\u00edcias do mundo, que anunciou negocia\u00e7\u00f5es de conte\u00fados para os desenvolvedores de IA. A colabora\u00e7\u00e3o com empresas de m\u00eddia t\u00eam o potencial de ampliar significativamente os conjuntos de dados dispon\u00edveis para treinamento, impulsionando a inova\u00e7\u00e3o no campo da intelig\u00eancia artificial.<\/p>\n\n\n\n<p>Outro caminho para garantir a longevidade das IAs s\u00e3o os esfor\u00e7os para aprimorar a gera\u00e7\u00e3o dos dados sint\u00e9ticos, ou seja, informa\u00e7\u00f5es ilimitadas criadas por computadores que reproduzem as caracter\u00edsticas e padr\u00f5es do mundo real. Esse conte\u00fado \u00e9 gerado por algoritmos e simula\u00e7\u00f5es computacionais, utilizando tecnologias de intelig\u00eancia artificial generativa. Essa estrat\u00e9gia n\u00e3o s\u00f3 aumenta a disponibilidade de material para treinamento das IAs, como oferece uma alternativa eficaz para cen\u00e1rios em que a obten\u00e7\u00e3o de dados reais \u00e9 limitada ou restrita devido a quest\u00f5es de privacidade, seguran\u00e7a ou custo.<\/p>\n\n\n\n<p><em>Com informa\u00e7\u00f5es de&nbsp;<\/em><a class=\"\" href=\"https:\/\/techxplore.com\/news\/2023-11-ai.html\" target=\"_blank\" rel=\"noreferrer noopener\"><em>Techxplore<\/em><\/a><em>&nbsp;e&nbsp;<\/em><a class=\"\" href=\"https:\/\/aws.amazon.com\/pt\/what-is\/synthetic-data\/\" target=\"_blank\" rel=\"noreferrer noopener\"><em>Amazon<\/em><\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Dados utilizados para treinar modelos de\u00a0intelig\u00eancia artificial (IA)\u00a0est\u00e3o se tornando cada vez mais escassos. Pelo menos \u00e9 o que diz um estudo realizado por um grupo de institui\u00e7\u00f5es, incluindo a Epoch, Universidade de Aberdeen, MIT e Universidade de T\u00fcbingen, que alerta que esses recursos devem se esgotar at\u00e9 2026. Al\u00e9m disso, dados lingu\u00edsticos e de [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":11038,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[16],"tags":[],"class_list":["post-11037","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia"],"aioseo_notices":[],"jetpack_featured_media_url":"https:\/\/i0.wp.com\/minutobahia24h.com.br\/wp-content\/uploads\/2024\/04\/Sem-titulo-195.jpg?fit=1000%2C562&ssl=1","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/minutobahia24h.com.br\/index.php?rest_route=\/wp\/v2\/posts\/11037","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/minutobahia24h.com.br\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/minutobahia24h.com.br\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/minutobahia24h.com.br\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/minutobahia24h.com.br\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=11037"}],"version-history":[{"count":1,"href":"https:\/\/minutobahia24h.com.br\/index.php?rest_route=\/wp\/v2\/posts\/11037\/revisions"}],"predecessor-version":[{"id":11039,"href":"https:\/\/minutobahia24h.com.br\/index.php?rest_route=\/wp\/v2\/posts\/11037\/revisions\/11039"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/minutobahia24h.com.br\/index.php?rest_route=\/wp\/v2\/media\/11038"}],"wp:attachment":[{"href":"https:\/\/minutobahia24h.com.br\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=11037"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/minutobahia24h.com.br\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=11037"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/minutobahia24h.com.br\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=11037"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}