TI CorporativaBIEvoluindo de modelos LLM para modelos LAM

Evoluindo de modelos LLM para modelos LAM

-

Publicidade

Como apontado pelo Gartner os modelos LAM oferecerão um imenso potencial em vários setores, incluindo negócios, saúde, finanças e atendimento ao cliente. Ao combinar a capacidade analítica da IA com capacidades de execução, é possível ter novas possibilidades de automação, otimização e inovação, levando a melhores resultados e eficiência em todas as áreas da atividade humana.

Enquanto LLMs são modelos de IA treinados em grandes quantidades de dados de texto, onde aprendem a entender as relações entre palavras e frases e podem gerar texto coerente e gramaticalmente correto, as LAMs são modelos de IA treinados em dados que incluem texto e informações visuais. Além de entender a linguagem, os LAMs também podem aprender a realizar ações e interagir com o mundo real.

Modelos LAMs

Os modelos LAMs marcam um avanço fundamental na inteligência artificial, transcendendo as capacidades convencionais de geração de texto dos LLMs. Ao contrário dos LLMs que respondem com texto, os LAMs captam a intenção por trás da linguagem humana, decifrando objetivos complexos. Eles então traduzem esses objetivos em ações do mundo real, como por exemplo, filtrar e-mails com base em suas tarefas agendadas.

No mundo ideal, os LAMs funcionam em tempo real, oferecendo uma experiência dinâmica onde a tecnologia atua de acordo com suas solicitações. Os LAMs possuem um imenso potencial para remodelar a interação humano-computador e capacitar-nos para atingir objetivos de forma mais eficaz.

Os LAMs preenchem a lacuna entre a compreensão da linguagem humana e a ação no mundo real a partir de três pontos. São eles:

  • Decifrando o código da linguagem: os LAMs são treinados em grandes quantidades de dados de texto, o que lhes permite compreender as nuances da linguagem humana. Eles podem não apenas compreender o significado literal das palavras, mas também inferir a intenção por trás delas. Imagine dizer “Estou inundado de e-mails”. Um LLM pode apenas oferecer dicas genéricas de gerenciamento de e-mail. Mas um LAM pode interpretar sua frustração e sugerir a criação de filtros, automatização de respostas ou até mesmo agendamento de tempo dedicado para gerenciamento de e-mail.
  • Das palavras às ações: os LAMs não param na compreensão. Eles traduzem os objetivos e intenções compreendidos em uma sequência de etapas viáveis. Continuando com o exemplo do e-mail, um LAM poderia não apenas sugerir soluções, mas também iniciar ações como criar esses filtros ou agendar horários em seu calendário com base em suas preferências.
  • Atuando em tempo real: Idealmente, os LAMs operam em tempo real. Isso significa que eles podem analisar sua linguagem, compreender seus objetivos e executar as ações correspondentes instantaneamente. Imagine precisar de instruções enquanto dirige. Um LAM pode acessar aplicativos de navegação, encontrar a melhor rota com base nas condições do trânsito e até mesmo fornecer instruções passo a passo – tudo isso enquanto você se concentra na estrada.

A evolução de Large Language Models (LLMs) para Large Action Models (LAMs) representa um salto significativo nas capacidades da inteligência artificial. Abaixo listo as principais diferenças que distinguem os LAMs de seus predecessores, os LLMs:

Em essência, a transição de LLMs para LAMs significa uma mudança da IA centrada na linguagem para uma abordagem mais abrangente e multimodal. LAMs não são apenas sobre entender palavras; eles são sobre perceber e agir sobre a rica tapeçaria de informações que o mundo apresenta, marcando um passo crucial para alcançar a inteligência geral artificial.

É importante notar que LAMs ainda não são a tecnologia padrão no campo da IA. Eles ainda são considerados tecnologia experimental, mas estão rapidamente ganhando popularidade e devem se tornar mais prevalentes nos próximos anos. LAMs não são um termo diferente para a mesma coisa que LLMs, mas sim uma versão mais avançada deles.

Arquitetura Conceitual

Abaixo descrevo uma arquitetura conceitual para uma LAM. Por meio de um processo cíclico de captura de dados, análise e resposta adaptativa, a arquitetura visa refinar a tomada de decisões de IA e automatizar tarefas complexas. A arquitetura a seguir descreve uma estrutura genérica, consistindo em três estágios principais para processamento e resposta a entradas ambientais:

  1. Entrada:

Esta fase envolve a coleta de interações do usuário, como ações de teclado e mouse, capturas de tela alinhadas ao tempo e, opcionalmente, transcrições de narrações de áudio ou dados de acesso à rede. Essas entradas constituem os estados brutos e ações que servem como dados fundamentais para o mecanismo de aprendizado da IA.

  • Estágio de análise (“Engenharia de Prompt”):
  • Na fase de análise, há uma interação entre os dados registrados e o feedback do usuário.
  • Um gráfico de processo, que inclui o histórico de ações, é usado junto com uma API de Processo para construir prompts com resultados anteriores.
  • A mineração de processo também desempenha um importante papel, o que pode significar analisar o gráfico de processo para extrair padrões, fluxos de trabalho ou processos úteis.
  • Os prompts, ações e histórico de resultados alimentam uma “Cadeia de Código” ou “Automação de Prompt”, que provavelmente se refere à geração de código ou comandos a partir de prompts de linguagem natural.
  • Uma etapa de anonimização indica um processo de redução ou transformação para generalizar os dados, o que pode envolver a remoção ou alteração de identificadores pessoais para privacidade (opcional).

No geral, a fase de análise para refinar a tomada de decisão da IA combina dados históricos de interações anteriores com feedback do usuário para projetar prompts precisos que orientam ações subsequentes. Este processo utiliza um Gráfico de Processo e API, que juntos separam e organizam a entrada bruta em prompts estruturados. Esses prompts, informados por um histórico de ações e seus resultados, passam por uma etapa de mineração de processo para identificar caminhos de ação ideais. Além disso, os procedimentos de anonimização garantem que os dados de entrada sejam generalizados, aumentando a privacidade e a capacidade da IA de abstrair e aplicar seu aprendizado em diferentes contextos. Este estágio é essencial para traduzir os resultados pretendidos pelo usuário em tarefas executáveis para a IA.

3. Estágio de execução

  • Ações são executadas. Elas podem ser lógicas (executando uma função como say_hello()) ou literais (enviando um comando específico).
  • No geral, neste estágio, o sistema observa ativamente o estado ambiental atual e, usando modelos preditivos, gera ações sintéticas que são lógicas e sensíveis ao contexto.

LAMs na Área da Saúde

As aplicações de LAMs na área da saúde são enormes. Entre elas podemos destacar:

  • Diagnósticos aprimorados:

Têm o potencial de aprimorar significativamente as capacidades de diagnóstico na área da saúde. Ao analisar imagens médicas como raios X e ressonâncias magnéticas, os LAMs podem identificar e sinalizar lesões ou anormalidades suspeitas, auxiliando os radiologistas em suas avaliações. Além disso, os LAMs podem analisar dados do paciente, incluindo exames de sangue e sinais vitais, para identificar padrões que podem indicar doenças em potencial. Essa análise pode ajudar os profissionais de saúde a priorizar casos e agilizar o processo de diagnóstico. Além disso, os LAMs podem gerar relatórios preliminares destacando áreas de preocupação, o que pode levar a uma investigação mais aprofundada por especialistas, levando a diagnósticos mais oportunos e precisos.

  • Planejamento de tratamento personalizado:

A jornada do paciente é crucial para melhorar os resultados do paciente, e os LAMs podem desempenhar um papel vital nesse processo. Ao integrar dados do prontuário médico eletrônico (PEPs) e vastas bases de conhecimento médico, os LAMs podem analisar conjuntos de dados abrangentes para sugerir opções de tratamento adaptadas à condição específica do paciente, histórico médico e constituição genética. Essa abordagem personalizada pode ajudar os profissionais de saúde a tomar decisões mais informadas sobre estratégias de tratamento, potencialmente levando a melhores resultados para os pacientes. Além disso, os LAMs podem identificar potenciais interações medicamentosas e

sugerir medicamentos alternativos, ajudando a minimizar o risco de reações adversas e melhorar a eficácia geral do tratamento.

  • Monitoramento em tempo real e ajustes de tratamento: o monitoramento em tempo real e os ajustes de tratamento são essenciais na área da saúde, principalmente para pacientes com condições crônicas ou aqueles em recuperação de cirurgia. Os LAMs podem monitorar continuamente os sinais vitais do paciente, como frequência cardíaca e pressão arterial, por meio de dispositivos vestíveis ou equipamentos médicos conectados. Ao analisar tendências em sinais vitais, os LAMs podem alertar os profissionais de saúde sobre quaisquer mudanças significativas que possam indicar complicações. Além disso, com base em protocolos predefinidos e dados em tempo real, os LAMs podem recomendar ajustes nas dosagens de medicamentos dentro de limites predefinidos, otimizando a eficácia do tratamento e melhorando os resultados do paciente.
  • Melhor coordenação do atendimento ao paciente: coordenação do atendimento ao paciente é crucial para garantir que os pacientes recebam o atendimento certo na hora certa. Os LAMs podem automatizar tarefas relacionadas à coordenação do atendimento, como por exemplo agendar consultas de acompanhamento com base em planos de tratamento. Ao enviar lembretes personalizados de medicamentos aos pacientes por SMS ou aplicativos de saúde, os LAMs podem melhorar a adesão à medicação e os resultados gerais do paciente. Além disso, os LAMs podem gerar instruções pós-alta adaptadas às necessidades específicas do paciente e ao plano de recuperação, ajudando a facilitar uma transição suave do hospital para o atendimento domiciliar.
  • Suporte a telemedicina: telemedicina é cada vez mais popular, e os LAMs podem aprimorar a experiência de telemedicina para pacientes e profissionais de saúde. Os LAMs podem ser integrados a plataformas de telemedicina para conduzir consultas iniciais com pacientes (anamnese), reunindo histórico médico básico e sintomas por meio de chatbots ou interfaces de voz. Com base nos dados coletados, os LAMs podem recomendar se uma consulta virtual com um profissional de saúde é necessária, ajudando na triagem de pacientes de forma eficiente. Durante as consultas virtuais, os LAMs podem auxiliar os profissionais de saúde fornecendo acesso em tempo real aos registros médicos dos pacientes e destacando informações médicas relevantes, permitindo uma tomada de decisão mais assertiva.

Conclusão

Ainda existem muitos desafios para que possamos implementar LAMs em uma maior escala. Não é por acaso que o Gartner destaca que o o principal desafio é o de resolver o problema de alucinação que hoje acomete as Ias generativas de uma forma geral.

Soluções como geração aumentada de recuperação (RAG) é um caminho que a indústria está começando a adotar. Devemos ver muitos produtos para IA incorporando esses conceitos em suas soluções de IA generativa.

À medida que esses modelos continuam a amadurecer, as aplicações potenciais parecem ilimitadas, prontas para transformar profundamente nossas experiências digitais. Os LAMs não apenas se destacam na execução de tarefas com eficiência sem precedentes, mas também preenchem a lacuna entre a intenção humana e a execução computacional, promovendo um futuro onde a colaboração homem-máquina é perfeitamente intuitiva. A crescente incorporação de LAMs em vários domínios anuncia uma nova era marcada por aumento de produtividade, inovação e uma abordagem reinventada para resolução de problemas, preparando o cenário para uma era em que as complexidades da IA estão intrinsecamente entrelaçadas na vida cotidiana.

Outras publicações do mesmo autor:

 

Celso Viana
Mestre em Engenharia da Computação pelo Instituto de Pesquisas Tecnológicas do Estado de São Paulo (2008) e Graduado em Ciências Contábeis pelo Centro Universitário FIEO (1999). Arquiteto de Dados atuando desde 2013 na gestão de dados corporativos para a área de saúde. Professor de graduação e pós graduação em Big Data.

Latest news

Software para MSPs: indo além do preço ao procurar pelas ferramentas certas

Confira 5 dicas essenciais para escolher as melhores plataformas para compor o monitoramento e segurança da infraestrutura de TI dos seus clientes

Rápido, seguro e nativo: Chrome chega ao Windows no Snapdragon

"Projetamos o navegador Chrome para ser rápido, seguro e fácil de usar em desktops e dispositivos móveis, e estamos sempre procurando maneiras de levar essa experiência a mais pessoas", disse Hiroshi Lockheimer, Senior Vice President, Google.

Convergir segurança física e TI garante maior proteção para instalações, redes e negócios

Hoje, com o aumento das violações de dados em todo o mundo e as regulamentações de privacidade evoluindo rapidamente, é mais importante do que nunca que segurança física e TI trabalhem juntas para proteger instalações e infraestrutura de rede.

O impacto da IA generativa nas memórias RAM e SSDs: Um olhar sobre o futuro do hardware

Algoritmos de IA otimizados podem reduzir o uso de RAM ao aplicar técnicas como computação distribuída e processamento eficiente de dados, garantindo uma melhor utilização da memória disponível. Da mesma forma, um uso eficiente dos SSDs pode minimizar o impacto das operações de entrada/saída (I/O) no desempenho.
Publicidade

5 Insights sobre Gestão da Experiência

Empresas de referência em Gestão da Experiência crescem 190% mais que a média do seu segmento. É o que aponta o Relatório do Boston Consulting Group (BCG). E os resultados positivos não param por aí: o retorno de investimento pode ser até 55% maior para acionistas das empresas em um prazo de cinco anos e o NPS chega a aumentar cerca de 70%.

Vazamento de dados do Google revela os segredos do algoritmo de buscas e mostra o que realmente funciona

O vazamento de informações desmistifica uma série de declarações feitas nos últimos anos de que o Google utiliza determinadas variáveis para ranquear os sites. Entre as milhares de páginas, que funcionam como um repositório de informações, é possível definir com mais clareza quais dados são realmente usados para classificar o conteúdo da pesquisa, e pode-se ter uma ideia de quais informações a comunidade de SEO já imaginava que eram reais — mas o Google dizia que não.

Must read

Software para MSPs: indo além do preço ao procurar pelas ferramentas certas

Confira 5 dicas essenciais para escolher as melhores plataformas para compor o monitoramento e segurança da infraestrutura de TI dos seus clientes

Rápido, seguro e nativo: Chrome chega ao Windows no Snapdragon

"Projetamos o navegador Chrome para ser rápido, seguro e fácil de usar em desktops e dispositivos móveis, e estamos sempre procurando maneiras de levar essa experiência a mais pessoas", disse Hiroshi Lockheimer, Senior Vice President, Google.
- Advertisement -

You might also likeRELATED
Recommended to you