Bitget App
Trading Inteligente
Comprar criptoMercadosTradingFuturosEarnWeb3CentroMás
Trading
Spot
Compra y vende cripto con facilidad
Margen
Aumenta tu capital y maximiza tus fondos
Onchain
Going Onchain, without going Onchain!
Convert
Convierte sin comisiones ni deslizamiento
Explorar
Launchhub
Obtén ventajas desde el principio y empieza a ganar
Copy
Copia al trader elite con un solo clic
Bots
Bot de trading con IA sencillo, rápido y confiable
Trading
Futuros USDT-M
Tradea futuros liquidados en USDT
Futuros USDC-M
Futuros liquidados en USDC
Futuros Coin-M
Tradea futuros liquidados en cripto
Explorar
Guía de Futuros
Un recorrido de principiante a experto en el trading de futuros
Promociones de futuros
Gana grandes recompensas
Resumen
Una variedad de productos para incrementar tus activos
Simple Earn
Deposita y retira en cualquier momento para obtener retornos flexibles sin riesgo.
On-chain Earn
Obtén ganancias diarias sin arriesgar tu capital
Earn estructurado
Innovación financiera sólida para sortear las oscilaciones del mercado
VIP y Gestión Patrimonial
Aumenta tu patrimonio con nuestro equipo de primer
Préstamos
Préstamos flexibles con alta seguridad de fondos
OpenAI lanza actualizaciones para la inferencia en tiempo real en audio, visión y texto

OpenAI lanza actualizaciones para la inferencia en tiempo real en audio, visión y texto

Ver el original
Bitget2024/10/02 14:17

Según Cointelegraph, OpenAI realizó cuatro actualizaciones a sus modelos en octubre para ayudar a sus modelos de IA a llevar a cabo mejor las conversaciones y mejorar el reconocimiento de imágenes. La primera gran actualización es una API en tiempo real que permite a los desarrolladores crear aplicaciones de voz generadas por IA utilizando un solo aviso, lo que permite conversaciones naturales similares a los patrones de habla avanzados de ChatGPT. Anteriormente, los desarrolladores tenían que "unir" múltiples modelos para crear estas experiencias. La entrada de audio generalmente necesita ser completamente cargada y procesada antes de recibir una respuesta, lo que significa que las aplicaciones en tiempo real, como las conversaciones de voz a voz, tienen alta latencia. Con las capacidades de transmisión de la API en tiempo real, los desarrolladores ahora pueden realizar interacciones instantáneas y naturales, al igual que un asistente de voz. Ejecutándose en GPT-4, que se lanzará en mayo de 2024, la API permite inferencia en tiempo real a través de audio, visión y texto. Otra actualización incluye herramientas de ajuste fino para desarrolladores que les permiten mejorar las respuestas de IA generadas a partir de entradas de imagen y texto. El ajustador fino basado en imágenes permite a la IA comprender mejor las imágenes, lo que lleva a una búsqueda visual mejorada y detección de objetos. El proceso incluye retroalimentación de humanos que proporcionan ejemplos de buenas y malas respuestas para el entrenamiento. Además de las actualizaciones de voz y visión, OpenAI ha introducido "destilación de modelos" y "almacenamiento en caché de señales", que permiten a los modelos más pequeños aprender de los más grandes y reducir los costos y el tiempo de desarrollo al reutilizar texto procesado. OpenAI espera que los ingresos aumenten a $11.6 mil millones el próximo año, frente a los $3.7 mil millones proyectados para 2024, según Reuters.

0

Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.

PoolX: Bloquea y gana nuevos tokens.
APR de hasta 12%. Gana más airdrop bloqueando más.
¡Bloquea ahora!