A startup de inteligência artificial Speechify está revolucionando o mercado de audiolivros ao permitir que os ouvintes tenham um papel ativo na experiência auditiva. Através da sua tecnologia, usuários podem importar suas próprias vozes para criar clones de IA, possibilitando a leitura de textos com suas próprias vozes ou outras de sua escolha. Por exemplo, o CEO da empresa, Cliff Weitzman, utiliza a voz de sua namorada. Além disso, celebridades como Snoop Dogg e Gwyneth Paltrow também disponibilizaram suas vozes para serem usadas pelos ouvintes, embora sejam geradas por IA e não locuções diretamente feitas por eles.
Segundo Weitzman, a capacidade de escolha de vozes é o que diferencia a Speechify de outras grandes empresas do setor, como Apple Books, Audible e Spotify. O mercado de audiolivros tem mostrado um crescimento contínuo; conforme a Audio Publishers Association (APA), 2023 registrou o 12º ano consecutivo de aumento nas vendas, totalizando aproximadamente US$ 2 bilhões. Adicionalmente, a APA identificou que 52% dos adultos nos EUA já ouviram um audiolivro, o que representa cerca de 150 milhões de pessoas.
Com a crescente influência da inteligência artificial, especialmente a generativa, diversos empreendedores têm explorado essa tecnologia para inovar em várias indústrias, incluindo direito, medicina e a própria IA generativa. Fundada há sete anos, a Speechify se posiciona como uma alternativa aos audiolivros tradicionais por meio do uso de vozes humanas geradas por IA.
Weitzman, que é disléxico, dependia inicialmente dos pais para a leitura de livros. Na universidade, ao não encontrar versões em áudio dos livros didáticos, ele desenvolveu um programa que utilizava aprendizado profundo e texto concatenativo para fala, uma técnica que usa amostras pré-gravadas. Além disso, o falante nativo de hebraico incluiu a opção de alterar a velocidade de leitura, um recurso ainda presente na Speechify.
Em 2018, seu irmão Tyler Weitzman se junta como cofundador e, desde 2022, atua como chefe de IA e presidente. Ele ajudou a criar o algoritmo que se tornou a primeira versão do Speechify, treinada em 100.000 horas de áudio para que a leitura soasse natural. Conforme o produto foi aprimorado, celebridades também passaram a participar, emprestando suas vozes.
O Speechify é capaz de ler livros, documentos e artigos em dispositivos móveis. O usuário pode carregar um PDF via aplicativo web ou utilizar a extensão do Chrome para ouvir textos de serviços como Google Drive, iCloud ou Dropbox. A versão gratuita do Speechify inclui seis vozes geradas por computador e permite velocidades de até 1x. A versão Premium, que custa US$ 11,67 por mês, oferece mais de 250 vozes de leitura em mais de 50 idiomas e velocidades de até 4,5x. De acordo com Cliff Weitzman, a plataforma conta com 40 milhões de usuários. Contudo, ao inscrever-se, o aplicativo informa que são mais de 23 milhões os usuários.
A Speechify foi fundada com um investimento inicial de US$ 4,5 milhões em 2020, embora a empresa não tenha fornecido detalhes adicionais sobre o financiamento. O caso da Speechify exemplifica como startups de IA estão transformando o panorama da tecnologia através da inovação aplicada a necessidades cotidianas. Para saber mais sobre inteligência artificial e suas aplicações, visite o hub AI Atlas, que oferece análises de produtos, notícias, dicas e explicações detalhadas.