52 termos de Inteligência Artificial explicados em português simples. De iniciante a avançado — sem jargão desnecessário.
52 termos encontrados
Mecanismo que permite ao modelo focar em partes específicas da entrada ao gerar cada parte da saída, similar a como humanos prestam atenção seletiva ao ler.
Sistema de IA autônomo que percebe seu ambiente, toma decisões e executa ações em sequência para completar objetivos complexos, podendo usar ferramentas externas.
Quando um modelo de IA gera informações plausíveis mas factualmente incorretas com aparente confiança, como inventar referências bibliográficas, datas ou fatos.
Campo de pesquisa focado em garantir que sistemas de IA ajam de acordo com valores e intenções humanas, sendo úteis, inofensivos e honestos mesmo à medida que se tornam mais capazes.
Interface de programação que permite a desenvolvedores integrar capacidades de modelos de IA em suas aplicações sem precisar hospedar os modelos eles mesmos.
Refere-se a um Agente de IA que pode operar de forma independente por um período estendido, com a capacidade de definir seus próprios objetivos intermediários, planejar ações, executar tarefas, aprender com o ambiente e se adaptar para alcançar um objetivo principal sem supervisão humana constante. Eles geralmente incorporam módulos de memória, planejamento e raciocínio.
É a capacidade de um modelo de IA, geralmente um LLM ou agente, de avaliar suas próprias saídas, identificar erros ou áreas de melhoria e então gerar uma versão corrigida ou aprimorada. Isso é frequentemente alcançado através de um processo iterativo, onde o modelo usa feedback interno ou um conjunto de critérios para guiar suas revisões.
Uma técnica avançada de raciocínio para Large Language Models (LLMs) que explora múltiplos caminhos de pensamento ou "ramificações" (sub-problemas, planos ou ideias) para chegar a uma solução mais robusta e precisa. Diferente da abordagem linear do Chain of Thought, o ToT avalia e seleciona as melhores opções em cada etapa, permitindo uma resolução de problemas mais complexa e estratégica.
Banco de dados especializado em armazenar e buscar embeddings vetoriais, permitindo buscas semânticas (por significado, não por palavras exatas). Essencial para sistemas RAG.
Técnica de prompt que instrui o modelo a mostrar seu raciocínio passo a passo antes de dar a resposta final, melhorando significativamente a precisão em tarefas de lógica e matemática.
Subconjunto do Machine Learning que usa redes neurais artificiais com muitas camadas (por isso "profundo") para aprender representações complexas dos dados.
Coleção organizada de dados usada para treinar, validar ou testar modelos de IA. A qualidade e diversidade do dataset influenciam diretamente o desempenho do modelo.
Conteúdo de vídeo, áudio ou imagem gerado por IA que mostra pessoas fazendo ou dizendo coisas que nunca fizeram, com alto grau de realismo.
Representações numéricas (vetores) de palavras, frases ou outros dados em um espaço de alta dimensão, onde itens com significados similares ficam próximos matematicamente.
Processo de continuar o treinamento de um modelo pré-treinado com um conjunto menor e específico de dados para adaptá-lo a uma tarefa ou domínio particular.
Capacidade de LLMs de identificar quando precisam usar uma ferramenta externa e chamar funções pré-definidas com os parâmetros corretos, integrando o modelo a sistemas reais.
Campo da ciência da computação que busca criar sistemas capazes de realizar tarefas que normalmente exigiriam inteligência humana, como reconhecer padrões, aprender com dados e tomar decisões.
Categoria de IA capaz de criar conteúdo novo e original — texto, imagens, áudio, vídeo, código — aprendendo padrões de grandes volumes de dados de treinamento.
Conjunto de princípios e práticas para desenvolver e implantar IA de forma ética, transparente, justa e responsável, considerando impactos sociais e riscos.
É uma abordagem para alinhar modelos de linguagem grandes (LLMs) com valores humanos, usando um conjunto de princípios ou "constituições" para guiar seu comportamento. O modelo é treinado para auto-criticar e revisar suas respostas com base nesses princípios, reduzindo a necessidade de intervenção humana direta no feedback de alinhamento.
É um campo da Inteligência Artificial focado em tornar os modelos de IA mais compreensíveis e transparentes para os seres humanos. O objetivo é permitir que as pessoas entendam por que um modelo chegou a uma determinada decisão ou previsão, em vez de apenas saber o resultado, o que é crucial para confiança, auditoria e conformidade regulatória.
Quantidade máxima de tokens que um modelo pode processar de uma vez — tanto o histórico da conversa quanto a resposta. Modelos com maior contexto podem trabalhar com documentos mais longos.
Tentativa de contornar as salvaguardas de segurança de um modelo de IA usando prompts elaborados para fazê-lo gerar conteúdo que normalmente recusaria.
Modelo de linguagem de grande escala treinado em vastos volumes de texto para entender e gerar linguagem humana. São a base de assistentes como ChatGPT, Claude e Gemini.
Framework open source em Python e JavaScript que facilita a criação de aplicações com LLMs, fornecendo abstrações para chains, agentes, memória e integração com ferramentas externas.
Técnica eficiente de fine-tuning que treina apenas uma pequena quantidade de parâmetros adicionais (adaptadores) em vez de todo o modelo, reduzindo drasticamente custo e tempo.
Subcampo da IA onde os sistemas aprendem automaticamente a partir de dados, melhorando seu desempenho com a experiência, sem serem explicitamente programados para cada tarefa.
Capacidade de um modelo processar e gerar múltiplos tipos de dados (texto, imagem, áudio, vídeo) em uma única arquitetura unificada.
Modelo de IA cujos pesos (parâmetros treinados) são disponibilizados publicamente, permitindo que qualquer pessoa os use, modifique e implante localmente.
Protocolo aberto criado pela Anthropic que padroniza como modelos de IA se conectam a ferramentas externas, bancos de dados e serviços, similar a como USB padroniza conexões de hardware.
Um tipo de modelo de IA multimodal que integra a compreensão de linguagem natural com a análise de informações visuais, como imagens e vídeos. VLMs permitem que a IA interprete e responda a perguntas, gere descrições ou execute tarefas que dependem tanto de texto quanto de conteúdo visual de forma conjunta.
Área da IA que trata da interação entre computadores e linguagem humana, permitindo que máquinas leiam, entendam e gerem texto de forma significativa.
Quando um modelo aprende os dados de treinamento "de cor", incluindo ruídos e detalhes irrelevantes, perdendo a capacidade de generalizar para dados novos.
Ferramenta que permite rodar modelos de IA open source (como Llama, Mistral, DeepSeek) localmente no seu computador, sem enviar dados para servidores externos.
O processo de coordenação e gerenciamento de múltiplos Agentes de IA que trabalham em conjunto para alcançar um objetivo comum. Isso envolve a definição de papéis, a comunicação entre os agentes, o gerenciamento do fluxo de trabalho e a resolução de conflitos, otimizando a colaboração para a execução de tarefas complexas de forma autônoma.
É a prática de gerenciar e encadear múltiplos prompts e/ou interações com um ou mais modelos de IA para alcançar um objetivo complexo. Isso envolve a definição de fluxos de trabalho, condicionais e a integração de resultados de um prompt como entrada para o próximo, muitas vezes utilizando frameworks e ferramentas específicas para otimizar o processo e a coerência das respostas.
Valores numéricos ajustáveis dentro de uma rede neural que são aprendidos durante o treinamento. Quanto mais parâmetros, maior a capacidade do modelo — e maior o custo computacional.
Fase inicial do treinamento de LLMs onde o modelo aprende padrões gerais da linguagem processando enormes volumes de texto da internet, livros e outras fontes.
Instrução, pergunta ou texto fornecido a um modelo de IA para guiar sua resposta. A qualidade do prompt determina diretamente a qualidade da saída.
Prática de formular e otimizar instruções para modelos de IA a fim de obter resultados mais precisos, relevantes e úteis. É considerada uma habilidade profissional em ascensão.
Técnica de compressão de modelos de IA que reduz a precisão dos pesos (de 32-bit para 4-bit, por exemplo), diminuindo drasticamente o uso de memória com pequena perda de qualidade.
Sistema computacional inspirado no funcionamento do cérebro humano, composto por nós (neurônios artificiais) conectados em camadas que processam e transmitem informações.
Técnica de treinamento onde avaliadores humanos classificam respostas do modelo, e esse feedback é usado para treinar um modelo de recompensa que guia melhorias subsequentes.
Técnica que combina recuperação de informações de um banco de dados externo com a geração de texto por LLM, permitindo respostas baseadas em documentos atualizados sem retreinar o modelo.
Um processo sistemático e proativo onde equipes ou indivíduos (os "red teamers") atuam como potenciais adversários para descobrir vulnerabilidades, falhas de segurança, vieses ou comportamentos indesejados em um sistema de IA, especialmente em Large Language Models. O objetivo é testar os limites e a robustez do modelo, forçando-o a gerar saídas problemáticas ou a se comportar de maneira inesperada, para que essas falhas possam ser corrigidas antes da implantação.
São modelos de linguagem menores que os LLMs (Large Language Models), projetados para serem mais eficientes em termos de computação, memória e energia. Apesar de seu tamanho reduzido, os SLMs podem ser otimizados para tarefas específicas, oferecendo desempenho comparável ou superior aos LLMs maiores em cenários limitados, sendo ideais para dispositivos de ponta (edge devices) ou aplicações com recursos limitados.
Arquitetura de rede neural introduzida em 2017 no paper "Attention Is All You Need" que revolucionou o NLP. Usa mecanismos de atenção para processar sequências inteiras de dados em paralelo.
Unidade básica de texto que LLMs processam. Pode ser uma palavra, parte de uma palavra, ou pontuação. Preços de API de IA são cobrados por token — tipicamente 1 token ≈ 0,75 palavras em inglês.
Parâmetro que controla a aleatoriedade nas respostas do modelo. Temperatura baixa (próxima de 0) gera respostas mais determinísticas e conservadoras; alta (próxima de 2) gera respostas mais criativas e variadas.
Capacidade de gerar imagens a partir de descrições textuais (prompts). Baseada em modelos de difusão ou transformers treinados em pares texto-imagem.
A capacidade de um modelo de IA, especialmente um Agente de IA, de interagir e utilizar ferramentas externas (como APIs, bancos de dados ou navegadores web) para estender suas capacidades, acessar informações em tempo real ou executar ações específicas que não consegue fazer intrinsecamente. Isso permite que a IA vá além de apenas gerar texto e execute ações no mundo real.
Tendências sistemáticas em modelos de IA que podem levar a resultados injustos ou discriminatórios, geralmente herdadas de dados de treinamento que refletem preconceitos históricos.