Apple Vision Pro, IA na WWDC23 e Outras Novidades Quentes do Universo da Inteligência Artificial
A semana foi agitada no mundo da tecnologia, especialmente no campo da Inteligência Artificial (IA). Embora o evento WWDC23 da Apple, com o anúncio do Vision Pro, tenha dominado as manchetes, diversas outras inovações e discussões importantes merecem destaque. Vamos mergulhar nas principais novidades, desde o "computador espacial" da Apple até os avanços em geração de conteúdo por IA e os desafios éticos que emergem com essa rápida evolução.
O Impacto da Apple no Cenário da IA: WWDC23 e o Vision Pro
A conferência anual de desenvolvedores da Apple, a WWDC (Worldwide Developers Conference), apelidada carinhosamente de "DubDub", sempre gera grande expectativa. Este ano, o foco esteve claramente voltado para novas experiências de hardware e software, com a IA, ou como a Apple prefere chamar, o Aprendizado de Máquina (Machine Learning), permeando muitas das atualizações.
Apple Vision Pro: O Computador Espacial e Suas Implicações
O grande anúncio da Apple foi, sem dúvida, o Apple Vision Pro, descrito pela empresa como seu primeiro "computador espacial". Trata-se de um headset de realidade mista (MR) com um design impressionante e especificações robustas. No entanto, o dispositivo, que será lançado no próximo ano, chegará ao mercado com um preço elevado de US$3.500 e uma autonomia de bateria de apenas duas horas. Curiosamente, como apontado no vídeo, se alguém assistisse ao evento da WWDC utilizando o Vision Pro, a bateria não duraria até o final da apresentação. A Meta, principal concorrente nesse segmento com seus headsets Quest, divulgou um memorando interno, conforme reportado pelo The Verge, onde Mark Zuckerberg expressou otimismo sobre o futuro do Meta Quest, destacando que o Vision Pro não apresenta "soluções mágicas" que a Meta já não tenha explorado e que o custo é significativamente maior, demandando sete vezes mais energia e a necessidade de uma bateria externa.
iOS 17: Inteligência (ou Aprendizado de Máquina?) no Seu Bolso
O iOS 17 também trouxe uma série de novidades que utilizam o que a Apple descreve como aprendizado de máquina. A empresa parece evitar o termo "IA", possivelmente por questões de marketing ou para diferenciar sua abordagem. Entre as novas funcionalidades estão:
- Transcrição de Voicemail em Tempo Real: Permite ler mensagens de voz enquanto estão sendo deixadas.
- Adesivos Personalizados: Criação de adesivos a partir de fotos.
- Transcrição de Mensagens de Áudio: Mensagens de áudio recebidas em textos agora são transcritas automaticamente.
- Autocorreção Aprimorada: Utilizando modelos de linguagem, a autocorreção se torna mais inteligente e adaptada ao estilo de escrita do usuário.
- Atualização da Siri: A mudança mais notável é que agora basta dizer "Siri" em vez de "Hey Siri" para ativar a assistente.
- Melhorias em PDFs no iPad: O iPadOS agora identifica campos de formulários em PDFs, permitindo o preenchimento automático com informações de contato, inclusive em documentos escaneados.
Essas atualizações, embora úteis, foram vistas por alguns como incrementais, especialmente quando comparadas aos grandes saltos de outras empresas no campo da IA generativa, levando a memes como o que compara a Microsoft criando o Co-Pilot, o Google criando o Bard e a Apple "consertando a autocorreção".
Avanços e Ferramentas Inovadoras em Inteligência Artificial
Além da Apple, outras empresas continuam a impulsionar a inovação em IA, com lançamentos e pesquisas promissoras.
Geração de Imagens e Vídeos com IA: Novas Fronteiras
Google StyleDrop: Personalizando Estilos Visuais
O Google apresentou o StyleDrop, uma pesquisa que permite gerar novas imagens seguindo um estilo específico a partir de uma única imagem de referência. Embora ainda não esteja disponível publicamente, os exemplos demonstram um potencial impressionante para replicar diversos estilos artísticos, desde aquarela até gráficos de videogame, em diferentes prompts.
Runway Gen-2: Texto para Vídeo Acessível ao Público
A Runway ML tornou o Gen-2, seu modelo de geração de vídeo a partir de texto, acessível ao público. Agora, qualquer pessoa pode experimentar a criação de vídeos curtos (até 4 segundos por vez, com 90 segundos gratuitos antes de necessitar de um plano pago) diretamente no site da RunwayML. A qualidade e coerência dos vídeos gerados são notáveis, representando um avanço significativo na tecnologia de texto para vídeo.
Clipdrop Uncrop da Stability AI: Expandindo Horizontes Visuais
A Stability AI, através da sua plataforma Clipdrop, lançou o "Uncrop". Similar ao preenchimento generativo do Photoshop, essa ferramenta permite expandir as bordas de uma imagem, com a IA preenchendo o espaço adicional de forma coerente. O Uncrop está disponível gratuitamente para experimentação.
Flair AI: Revolucionando Fotos de Produtos
A Flair AI demonstrou uma ferramenta que permite criar fotos de produtos impressionantes. É possível adicionar modelos humanos, ajustar poses, tons de pele e ambientes, tudo gerado por IA para destacar produtos físicos de e-commerce de maneira altamente personalizável e inclusiva.
Modelos de Linguagem e Chatbots: A Evolução da Conversação
Falcon LLM da Hugging Face: Poder Open Source
A Hugging Face lançou o Falcon, um modelo de linguagem grande (LLM) de 40 bilhões de parâmetros que, segundo seus testes, supera outros modelos open source. Embora demande considerável poder de processamento (cerca de 90GB de memória GPU), a plataforma oferece um demo para interação, mostrando o potencial dos modelos abertos.
Instagram e Seus Rumores de Chatbot com IA
Vazamentos sugerem que o Instagram está trabalhando em um chatbot com IA que poderá responder perguntas, dar conselhos e até ajudar a escrever mensagens, oferecendo 30 personalidades diferentes para interação. Ainda não há confirmação oficial, mas é uma possibilidade interessante.
Jetpack AI Assistant: Escrita Criativa para WordPress
A Automattic, empresa por trás do WordPress.com, lançou o Jetpack AI Assistant. Trata-se de um plugin para WordPress que auxilia na criação de posts de blog, ajustando o tom, verificando ortografia e gramática, e funcionando de forma conversacional, similar a ferramentas como o Jasper.
Bard do Google: Aprimorando Lógica e Raciocínio
O Bard, chatbot do Google, recebeu atualizações para melhorar sua capacidade de lógica e raciocínio, especialmente em tarefas matemáticas e de programação, além de uma nova funcionalidade para exportar tabelas diretamente para o Google Sheets.
IA no Desenvolvimento e Criação 3D
Daz 3D e Tafi: Texto para Personagens 3D
A Daz 3D, em parceria com a Tafi, anunciou um motor de criação de personagens 3D a partir de texto. A demonstração mostra a capacidade de gerar e modificar personagens 3D detalhados através de prompts de texto, com opções de exportação para ferramentas como Unreal Engine, abrindo novas possibilidades para desenvolvedores de jogos e criadores de conteúdo.
Convai: NPCs Inteligentes para Mundos Virtuais
A Convai é uma plataforma que permite criar personagens não jogáveis (NPCs) com personalidades, histórias de fundo e estilos de conversação únicos para videogames. Esses NPCs podem ter conversas em tempo real com os jogadores, como demonstrado no evento Computex por Jensen Huang da Nvidia. Combinando ferramentas como a da Daz 3D para a aparência e a Convai para a inteligência conversacional, a criação de mundos virtuais ricos e interativos está se tornando cada vez mais acessível.
Ferramentas de Codificação e Deepfake
Comate da Baidu: Assistente de Codificação na Nuvem
A gigante chinesa Baidu lançou o Comate, um assistente de codificação em nuvem baseado em IA que auto completa código, similar ao GitHub Copilot e Amazon CodeWhisperer.
Roop: A Controvérsia do Face Swapping Open Source
Uma ferramenta open source chamada Roop, disponível no GitHub, permite trocar rostos em vídeos com apenas uma imagem de referência do rosto desejado. Embora possa ser usada para fins criativos e divertidos, como o exemplo da abertura da série "The Office" com o rosto do criador do vídeo em todos os personagens, levanta sérias preocupações sobre o potencial de mau uso para deepfakes e desinformação.
Desafios Éticos e Regulatórios da Inteligência Artificial
O rápido avanço da IA traz consigo a necessidade urgente de discutir e implementar medidas para mitigar riscos.
A Urgência da Rotulagem de Conteúdo Gerado por IA
A União Europeia está pressionando empresas como Google e Facebook para rotularem claramente conteúdos gerados por IA. Essa medida visa combater a desinformação, permitindo que os usuários identifiquem facilmente se uma imagem, vídeo ou texto foi criado artificialmente. A discussão sobre a fiscalização e aplicação dessas regras ainda está em andamento.
IA na Política: O Caso das Imagens Falsas na Campanha de DeSantis
A preocupação com o uso de IA para desinformação já é uma realidade. Recentemente, a campanha de Ron DeSantis utilizou imagens geradas por IA mostrando Donald Trump abraçando e beijando Anthony Fauci, numa tentativa de desacreditar o ex-presidente. Esse incidente, como noticiado pelo The Verge, exemplifica como a IA pode ser explorada em contextos políticos, ressaltando a importância da rotulagem e da educação do público para identificar tais manipulações. Sam Altman, CEO da OpenAI, já havia alertado sobre esses riscos durante sua audiência no Senado americano.
Conclusão
A cada semana, o universo da Inteligência Artificial nos presenteia com uma avalanche de novidades, ferramentas e debates. Desde os avanços em realidade mista da Apple até as novas capacidades de geração de conteúdo e os desafios éticos que se impõem, fica claro que estamos vivendo um momento de transformação acelerada. Manter-se atualizado é crucial, e plataformas como o FutureTools.io, que agrega notícias e ferramentas de IA, tornam-se cada vez mais valiosas para navegar neste cenário em constante evolução. A IA não é apenas uma promessa futura; ela já está moldando nosso presente de maneiras profundas e, por vezes, inquietantes.