非常棒的播客产品,看起来是把MOSS-TTSD的能力落地了,并且有非常完善的基础设施(账号资产、发现广场、积分、社交裂变、音色克隆),同时还有chrome插件,方便把懒得看的页面一键转成播客节目。
产品核心价值:
给播客主理人们降低节目录制门槛
给C端用户自己用来“文本转音频” (公众号文章、电子书、arxiv论文等等等等…)
目前使用一次文字转播客是10积分,input形式支持text、url、pdf,免费用户每个月可以获得50分配额,转好的播客分享出去被他人播放也会有积分奖励,裂变闭环了。充值的话84块800分,合下来每次转播客1块多一点点。音色克隆是需要开通付费会员后,录一个30秒的音频邮件发给作者,作者会帮忙生成音色,仅限音色上传者自己使用。
转音频的效果:
口语化效果很好,听起来没有生硬的AI感,得益于Orange老师强大的prompt,这里比较好奇背后的把原始文本转成TTS口播脚本的模型用的哪个,好像对prompt里 “口语化”、“语言生动化” 等指令遵循的非常好;
文本转音频的速度,测下来大概1-2分钟,非常迅速;
播放体验:web没啥问题,分享出去以后在移动端的体验提个小优化点,微信打开分享链接以后起播,然后这个页面不能退,退掉的话音频也就停了,如果能接到微信那个音频播放组件可以挂起来不影响退页面做别的事情就好了;
再多提一嘴UI,设计感也非常在线,很喜欢这个ICON,另外播放器的毛玻璃效果也是比苹果超前用上了(狗头)
提俩不成熟的小建议:
目前pdf支持大小是10M限制,不知是否可能再放宽,哪怕积分消耗是按分段区间来多扣一点;
能不能多支持一个input类型:上传英文播客mp3,然后后边处理流程增加翻译成中文的环节;场景是因为现在订阅了一些外文AI领域大佬的访谈节目,英文水平不够自己翻起来比较费劲,如果能通过listenHub完成翻译+转录就太棒了!