Bitget App
Trading inteligente
Comprar criptoMercadosTradingFuturosRendaWeb3CentralMais
Trading
Spot
Compre e venda criptomoedas
Margem
Amplie seu capital e a eficiência de seus fundos
Onchain
Going Onchain, without going Onchain!
Convert
Sem taxas de corretagem e derrapagem
Explorar
Launchhub
Ganhe vantagens desde o início e comece a ganhar
Copy
Copie o trader de elite com um clique
Robôs
Robô de trading com IA simples, rápido e confiável
Trading
Futuros USDT
Futuros liquidados em USDT
Futuros USDC
Futuros liquidados em USDC
Futuros Coin-M
Futuros liquidados em criptomoedas
Explorar
Guia de futuros
Uma jornada no trading de futuros
Promoções de futuros
Aproveite recompensas generosas!
Renda Bitget
Uma série de produtos para aumentar seus ativos
Renda Simples
Deposite e retire a qualquer momento para obter retornos flexíveis com risco zero
Renda On-chain
Ganhe lucros diariamente sem arriscar o investimento inicial
Renda estruturada
Inovação financeira robusta para navegar pelas oscilações do mercado
VIP e Gestão de Patrimônio
Serviços premium para uma Gestão de Patrimônio inteligente
Empréstimos
Empréstimo flexível com alta segurança de fundos
OpenAI lança atualizações para inferência em tempo real em áudio, visão e texto

OpenAI lança atualizações para inferência em tempo real em áudio, visão e texto

Ver original
Bitget2024/10/02 14:17

De acordo com a Cointelegraph, a OpenAI fez quatro atualizações em seus modelos em outubro para ajudar seus modelos de IA a conduzirem melhor conversas e melhorarem o reconhecimento de imagens. A primeira grande atualização é uma API em tempo real que permite aos desenvolvedores criar aplicativos de fala gerados por IA usando um único prompt, possibilitando conversas naturais semelhantes aos padrões avançados de fala do ChatGPT. Anteriormente, os desenvolvedores tinham que "juntar" vários modelos para criar essas experiências. A entrada de áudio normalmente precisa ser totalmente carregada e processada antes que uma resposta seja recebida, o que significa que aplicativos em tempo real, como conversas de voz para fala, têm alta latência. Com as capacidades de streaming da API em tempo real, os desenvolvedores agora podem realizar interações instantâneas e naturais, assim como um assistente de voz. Rodando no GPT-4, que será lançado em maio de 2024, a API permite inferência em tempo real em áudio, visão e texto. Outra atualização inclui ferramentas de ajuste fino para desenvolvedores que permitem melhorar as respostas de IA geradas a partir de entradas de imagem e texto. O ajustador fino baseado em imagem permite que a IA entenda melhor as imagens, levando a uma busca visual aprimorada e detecção de objetos. O processo inclui feedback de humanos que fornecem exemplos de boas e más respostas para treinamento. Além das atualizações de fala e visão, a OpenAI introduziu "destilação de modelos" e "cache de dicas", que permitem que modelos menores aprendam com modelos maiores e reduzam custos e tempo de desenvolvimento reutilizando texto processado. A OpenAI espera que as receitas aumentem para US$ 11,6 bilhões no próximo ano, em comparação com uma projeção de US$ 3,7 bilhões em 2024, de acordo com a Reuters.

0

Aviso Legal: o conteúdo deste artigo reflete exclusivamente a opinião do autor e não representa a plataforma. Este artigo não deve servir como referência para a tomada de decisões de investimento.

PoolX: bloqueie e ganhe!
Até 10% de APR - Quanto mais você bloquear, mais poderá ganhar.
Bloquear agora!