Josh McGiff, da Universidade de Limerick, quer criar ferramentas generativas de IA como o ChatGPT para proteger a integridade do idioma irlandês.
Você sabe o que a inteligência artificial é como gaeilge?
Nos últimos anos, houve muita conversa nos últimos anos sobre a IA e as ferramentas de IA (Genai) especificamente generativas, como o ChatGPT, que o trouxeram para o mainstream, concorrentes como o Claude do Anthrópico e os distúrbios completos como o R1 do Deepseek.
Mas quando nos aproximamos SEACHETETA NA GAEILGEo maior festival de idiomas irlandeses do mundo, o SiliconRepublic.com queria falar com um pesquisador que está trabalhando em maneiras de preservar o idioma irlandês.
Josh McGiff é pesquisador de doutorado em IA e professor de engenharia de software imersiva na Universidade de Limerick (UL).
Tornar a tecnologia acessível é uma missão essencial para McGiff, como ele disse ao SiliconRepublic.com que as informações técnicas pesadas no início dos cursos de ciência da computação geralmente podem esmagar os sonhos dos alunos desde o início.
“Minhas palestras envolveram transformar um edifício inteiro em uma cena misteriosa de assassinato, onde os alunos tiveram que resolver meu assassinato usando o conhecimento da palestra, um banco de dados e pistas relacionadas à codificação escondidas ao redor do prédio; incorporar uma caça ao tesouro em uma palestra de desenvolvimento da web; fazendo uma aula em realidade virtual; E levando os alunos a construir um videogame em uma semana ”, disse ele.
“Agora estou se preparando para fazer algumas palestras convidadas emocionantes para outro curso que, esperançosamente, empurrará o barco para fora em termos de educação da IA”.
‘Acredito que Gaeilgeoirí deveria ter o direito de usar esse tipo de tecnologia em sua própria língua’
Fora de sua paixão pelo ensino, McGiff cresceu cercado pela língua irlandesa, tendo passado o verão com a família de sua mãe no oeste de Kerry e frequentando Gaelcholáiste Luimnigh, uma escola pós-primária.
“Não só faço parte da comunidade de jogos que joga como Gaeilge, mas também passei os últimos dois anos trabalhando no meu próprio jogo indie de língua irlandesa na Irlanda-estou super empolgado com isso.”
Durante sua graduação em UL, McGiff usou o aprendizado de máquina para construir um ‘sistema de detecção de homofobia’, dando -lhe uma base forte para continuar sua pesquisa no campo da IA.
“O ChatGPT acabara de aparecer nessa época e lembro -me de testar sua capacidade de produzir texto em Gaeilge. Descobri que era uma representação ruim do idioma com muitas inconsistências ”, afirmou.
“Isso, combinado com o apoio inestimável e orientação do meu supervisor, Dr. Nikola Nikolov, levou meu pedido de pesquisa ao Centro de Pesquisa da Irlanda de Treinamento de Pesquisa em Inteligência Artificial”.
Preservando a língua irlandesa com ai
A pesquisa de McGiff está centrada na construção de ferramentas genai, como o ChatGPT para o idioma irlandês.
“Senti que as abordagens existentes de ‘tamanho único’ para modelar o idioma irlandês desconsideraram os vários dialetos que são fundamentais para sua identidade”, disse ele.
“Percebi que construir um chatbot para o idioma irlandês poderia ser uma forma poderosa de preservação. Todos os meandros e características da língua irlandesa podem ser encapsulados em um modelo (algoritmo AI), protegendo -o efetivamente de desaparecer. ”
Uma das mais de 60 idiomas minoritários oficiais reconhecidos pela União Europeia, o irlandês foi classificado como “Definitivamente ameaçado”Por UNESCO. Embora a maioria das tecnologias de idiomas se concentre em idiomas amplamente utilizados, como inglês e chinês, o irlandês tem suporte digital limitado.
Este é um dos principais desafios que McGiff enfrenta em sua pesquisa. Com a falta de dados disponíveis na Web, idiomas com baixo teor de recursos, como os irlandeses, não tendem a ser bem capturados. Mas McGiff disse que está determinado a ajudar Gaeilgeoirí a prosperar na era digital.
Juntamente com a falta de dados, o poder computacional é outro problema que vem com a criação de ferramentas de IA, como o que McGiff deseja criar. Embora as principais empresas de tecnologia tenham acesso a máquinas que lhes permitam treinar modelos de ponta, pesquisadores como a McGiff são limitados pelo equipamento ao qual têm acesso-geralmente dentro da universidade em que trabalham.
“No entanto, restrições como essas estão permitindo que os pesquisadores explorem métodos mais ecológicos para criar essas ferramentas”, disse ele.
Enfrentando o desafio de dados
Em termos de fornecimento de dados no idioma irlandês, McGiff disse que houve algum trabalho incrível para criar conjuntos de dados públicos para o idioma. Em 2021, dois projetos de tecnologia receberam mais de € 350.000 em financiamento do governo para ajudar a evitar a “extinção digital” do idioma irlandês.
No entanto, a combinação das fontes existentes ainda equivale a uma fração dos dados gerais necessários para criar um modelo de IA que possa ser usado para fazer um serviço semelhante ao ChatGPT.
“Entrei em contato com muitas organizações e tive algum sucesso no desenvolvimento de um conjunto de dados mais forte”, disse McGiff. “Parte do desafio é enfrentar os medos associados às próprias ferramentas de IA. Com países como o Reino Unido explorando o uso de AI Chatbots em serviços públicos, impulsionar o Gaeilge firmemente para a era digital é essencial para evitar mais desigualdades de linguagem. ”
Enquanto ele continua a explorar todas as avenidas para adquirir dados irlandeses autênticos, McGiff também está desenvolvendo uma variedade de algoritmos para criar dados sintéticos. Isso envolve tomar frases e aplicar uma série de transformações para criar novos dados.
“Além disso, há algumas pesquisas que sugerem que a construção de modelos em idiomas relacionados pode equivaler a um grande impulso nos dados. Como resultado, estou construindo um modelo usando outras línguas goidelic, como Gaelic e Manx escocês ”, disse ele. “Uma combinação de todas essas técnicas de aumento deve ajudar a superar o desafio de dados limitados para esta pesquisa”.
Trazendo irlandeses para a era digital
McGiff disse que está preocupado que, como modelos de IA como o ChatGPT estão dominando como ferramentas em geral, não incluindo irlandês adequadamente poderia bloquear Gaeilgeoirí de muitos serviços.
“Acredito que Gaeilgeoirí deve ter o direito de usar esse tipo de tecnologia em seu próprio idioma. Caso contrário, os alto-falantes irlandeses poderiam ser excluídos dessas ferramentas para melhorar a produtividade ”, acrescentou.
“Além disso, os chatbots da AI existentes não modelaram com precisão o idioma. Se os aplicativos forem alimentados por essas ferramentas de IA existentes, as imprecisões poderão corroer o idioma irlandês ao longo do tempo. ”
McGiff também disse que a construção de um modelo de IA para representar com precisão o irlandês não apenas o preservará, mas também pode ajudar a cultivá -lo como um idioma.
Em termos práticos, isso pode significar que os alto -falantes irlandeses podem se envolver com mais serviços digitais em seus próprios idiomas, pode permitir que as empresas integrem ferramentas de IA para irlandês em seus produtos e programas de TV e videogames poderiam usar ferramentas de IA para localizar conteúdo para Gaelige.
“No geral, esta pesquisa pode preencher a lacuna na igualdade linguística, capacitando os falantes irlandeses a usar seu idioma perfeitamente na vida cotidiana e reduzir a dependência do inglês”, disse ele.
“Um modelo de IA para o idioma irlandês, construído por Gaeilgeoirí, será a chave para capacitar seus falantes e impulsionar o idioma para a era digital”.
Ah, e caso você esteja tão curioso quanto eu, o irlandês pela inteligência artificial é ‘Intleacht Shaorga’.
Não perca o conhecimento necessário para ter sucesso. Inscreva -se para o Breve diariamenteDigest de Notícias de Sci-Tech da República de Silício.