DeepSeek lança IA que supera o DALL-E 3 em geração de imagens

Publicado:

compartilhe esse conteúdo

A DeepSeek, empresa de IA que recentemente ganhou destaque com seu chatbot, surpreendeu o mundo da tecnologia novamente com o lançamento do Janus-Pro, uma nova família de modelos de IA multimodais capazes de analisar e gerar imagens.

Segundo a empresa, a novidade pode superar o DALL-E 3 da OpenAI em alguns testes.

O que é e como funciona o Janus-Pro da DeepSeek?

O Janus-Pro é um novo modelo de inteligência artificial (IA) multimodal, desenvolvido pela DeepSeek, capaz de analisar e criar imagens. Ele se destaca por sua arquitetura inovadora, chamada de “estrutura autorregressiva”, e por sua capacidade de superar modelos de IA renomados, como o DALL-E 3 da OpenAI, em benchmarks de avaliação.

O Janus-Pro funciona assim: ele aprende a interpretar e gerar imagens a partir de um conjunto massivo de dados. Sua “estrutura autorregressiva” permite processar informações sequencialmente, construindo a imagem passo a passo, como se estivesse “pintando” cada pixel em sequência.

Isso o torna mais eficiente na geração de imagens complexas e mais detalhadas, por exemplo.

janus pro teaser2
Arquitetura inovadora o torna uma ferramenta poderosa para desenvolvedores, artistas e pesquisadores, abrindo novas possibilidades para a criação e análise de conteúdo visual.. (Imagem: DeepSeek)

Principais características

  • Multimodal: consegue processar diferentes tipos de dados, como imagens e texto, de forma integrada. Isso permite que ele compreenda o contexto e gere resultados mais relevantes.
  • Eficiente: apresenta alto desempenho mesmo com um número menor de parâmetros em comparação com outros modelos, tornando-o mais leve e rápido.
  • Flexível: pode ser usado para diversas tarefas, desde a geração de imagens a partir de descrições textuais até a análise e edição de imagens existentes.
  • Código aberto: está disponível para download na plataforma Hugging Face sob a licença MIT, permitindo que desenvolvedores e pesquisadores o utilizem e modifiquem livremente.

O Janus-Pro está disponível em diferentes tamanhos, variando de 1 bilhão a 7 bilhões de parâmetros. Essa variedade permite que os usuários escolham o modelo mais adequado às suas necessidades, dependendo da complexidade da tarefa. Essa característica, coloca o Janus-Pro-7B, o maior da família, à frente de concorrentes como DALL-E 3, PixArt-alpha, Emu3-Gen e Stable Diffusion XL em testes como o GenEval e o DPG-Bench.

Celular com logomarca do DeepSeek colocado na frente de computador com página inicial da plataforma de inteligência artificial aberta num navegador
O Janus-Pro está disponível em diferentes tamanhos, variando de 1 bilhão a 7 bilhões de parâmetros.(Imagem: Mojahid Mottakin/Shutterstock)

As aplicações são vastas e abrangem diversas áreas, como:

  • Criação de conteúdo visual: geração de imagens originais para diferentes fins, como publicidade, design, jogos e arte digital.
  • Edição de imagens: aprimoramento e manipulação de imagens existentes, como restauração de fotos antigas, remoção de objetos e aplicação de filtros.
  • Análise de imagens: extração de informações relevantes de imagens, como reconhecimento de objetos, detecção de emoções e classificação de conteúdo.

Leia mais:

  • DeepSeek: Assistente de IA é alvo de ciberataque; empresa suspende cadastros
  • DeepSeek: conheça a IA chinesa que está desafiando o ChatGPT
  • ChatGPT, Gemini e Copilot: 8 tarefas que ficam mais fáceis quando usamos a inteligência artificial

Vale lembrar que a DeepSeek, um laboratório chinês de IA financiado pela High-Flyer Capital Management, chamou a atenção do público recentemente quando seu aplicativo de chatbot alcançou o topo da App Store.

O lançamento do Janus-Pro reforça a posição da DeepSeek como um player importante no cenário da IA, impulsionando a inovação e desafiando os líderes já estabelecidos. A acessibilidade dos modelos e sua performance promissora abrem um leque de possibilidades para desenvolvedores e pesquisadores.

O post DeepSeek lança IA que supera o DALL-E 3 em geração de imagens apareceu primeiro em Olhar Digital.

Comentários do Facebook

Compartilhe esse artigo:

ÚLTIMAS NOTÍCIAS

Tesla Negocia Compra Bilionária de Equipamentos Solares com Empresas Chinesas

Resumo rápido: a Tesla negocia a aquisição de equipamentos chineses para ampliar a fabricação de painéis e células solares nos Estados Unidos, com...

Ozempic Sem Patente: Brasil Aflito por Genéricos. Novas Canetas Chegam em Breve?

Resumo rápido: a patente da semaglutida, ativo do Ozempic, expirou no Brasil, porém ainda não há versões nacionais mais acessíveis disponíveis. Ao todo,...

Chefe da NASA quer que Trump oficialize Plutão como planeta

Siga o Olhar Digital no Google Discover O debate sobre o status de Plutão, que já dura duas décadas, ganhou um novo capítulo. Jared...