这是真正的神,怪物级别。
要产品力有产品力,要病毒够病毒,你去跟它较真有没有真技术,会发现这里面是有真技术的,而且还是顶尖技术。
不同意?看看隔壁 veo3 吧,那是世界上最厉害的技术了,但磨磨唧唧,抠抠搜搜,弄得复杂又生硬,强调多元化强调尊重文化,但还不如 sam altman 直接蹦迪跳舞发神经来的爽。OpenAI 不是不会做影视级画面,也不是不愿意提升清晰度画质,他们是真的聪明,端出了社交网络和 AI 并行发展时代的最优解产品。
OpenAI 全新的 AI 音视频社交应用。
暂无相关文章
期待你给「Sora 2」写一篇深度文章
这是真正的神,怪物级别。
要产品力有产品力,要病毒够病毒,你去跟它较真有没有真技术,会发现这里面是有真技术的,而且还是顶尖技术。
不同意?看看隔壁 veo3 吧,那是世界上最厉害的技术了,但磨磨唧唧,抠抠搜搜,弄得复杂又生硬,强调多元化强调尊重文化,但还不如 sam altman 直接蹦迪跳舞发神经来的爽。OpenAI 不是不会做影视级画面,也不是不愿意提升清晰度画质,他们是真的聪明,端出了社交网络和 AI 并行发展时代的最优解产品。
你当然可以用一堆宏大理论分析它到底能不能成为AI抖音 、AI TikTok 。但好歹Sora是一个真的2C产品,而不是像之前的绝大部分的AI产品一样全是2B 2VC的 。Sora至少是有点整活、有点好玩的。有点好玩就遥遥领先了。
用户可能不需要一个纯ai生成内容的抖音
但OpenAI需要一个新的社区产品
且不能是通过ChatGPT增加功能得来的社区
这是一种必然的尝试,哪怕最后没了也是必要的
试了一周Sora 2,说说真话
朋友推荐我试试OpenAI刚出的Sora 2,说是能用文字生成视频。我一开始还挺怀疑的,毕竟之前那些AI视频看起来都怪怪的。
我随便输了个"小狗在草地上玩球",等了半分钟,出来的视频真的把我看傻了。那只金毛的毛发、跑步的姿态、甚至叼球时的表情都特别真实。我妈看了还问这是哪儿拍的。
最厉害的是物理效果很自然。球弹起来的轨迹、狗狗跳跃的动作,都符合常理,不像以前那些AI视频总是飘来飘去的。
这个我没想到。生成"咖啡厅聊天"的场景时,不光画面真实,连对话声、背景音乐、咖啡机的声音都有。虽然嘴型有时对不上,但整体效果已经很棒了。
Cameos功能有点神奇
可以把自己"插入"到任何场景里。我录了段视频后,就能让"我"和恐龙一起跑步,效果还挺逼真。朋友们都觉得很有意思。
不过说实话,这功能也让我有点担心。要是被坏人利用怎么办?
当然也不是完美的:
- 生成时间有点长,复杂场景要等几分钟
- 细节有时很奇怪,比如人会长出三只手
- 文字识别不行,招牌什么的都是乱码
- 风格有点单一,总有股"AI味儿"
社交功能还在起步
有个类似抖音的功能,能看别人生成的视频,也能remix。不过现在用户不多,内容质量参差不齐。
Sora 2确实很厉害,虽然还有不少问题,但已经能看出AI视频的巨大潜力。对我们普通人来说,就是个有趣的创作工具。
建议从简单的开始试,多试几次,保护好隐私。最重要的是,好创意比技术更重要。
技术很牛,但还需要完善。不过这个开始已经够让人兴奋的了。
---
个人体验,仅供参考。
分镜能力做的很好,算是行业的sota了,玩法也很创新 + 做了社交的病毒式裂变,整体算是一个好的产品
缺点:不能上传真人、不能做IP、API不稳定、视频训练的画风不多、不能生成长视频
Sora这玩意儿看视频是真惊艳!生成的视频质感、光影和逻辑都绝了,像变魔术一样。不过说实话,目前对咱普通人来说,更像是个“概念车”——看得多,摸不着。感觉它潜力巨大,未来搞不好能改变影视和短视频创作,但现在更多是科技公司和大佬们在玩。一边觉得酷,一边又觉得离日常还用不上,心情复杂。
粗浅地认为,这只是openai为sora2发布所进行的运营活动和营销噱头,不会也不可能撼动tiktok/抖音的地位;大家都低估了抖音的壁垒,庞大的用户数,大量版权在手,生态建设(汽水,今日头条,豆包等);同时,ai视频生成普及度也不够高,内容传播始终受到水印限制(不过这也正是openai的运营目的)
换个视角,抛开AI抖音这层外衣,Sora2的模型能力比Sora增强太多(没和其他视频生成模型着重对比),特别是在指令遵循和物理交互真实性上;并且Cameo 的合拍玩法,也展示了其良好的人物一致性。
可能国内媒体环境对类似代替抖音 tiktok 之类的宏大叙事还是太关注了,也天然代入了大公司做这个是想打 xxx 市场这种思维。
其实人家Open AI也未必这么想,单说 Sora App 的话,可以把一些想象的跟朋友、名人(目前只有sam了...)互动的场景低成本还原出来,至少对我这种之前基本不怎么玩 AI 视频生成的人来说有玩一下的兴趣,这里记录一下开始上手之后不由自主就开始做的几个视频(最近听了lovart创始人陈冕访谈里提到的,发现大家其实都是惊人的一致,这可能也说明产品设计用了心思,引导出了接近的爆发路径,而不是很多其他AI产品这样上手都不知道怎么样):
在Open AI发布会上sam跟我握手说看好我
在武当山山顶跟sam进行武术决斗
把家里不爱被人抱的猫做了一个亲亲贴贴的视频
骑着自家猫在高速上飞驰(参考银魂里的定春)
找也同样注册了的朋友开始各种格斗.。
《Sora2: 从记录生活,到创造生活》
Sora2 模型 本身是一次生产力的革命,但对应的生产关系一定要在抖音形态的产品里面呈现吗?
不一定。
因为记录生活,抖音每天产生 5000 万条视频、快手每天产生 4000 万条视频、TikTok 每天产生 3400 万条视频
这还是平均每人每天上传0.1条视频的情况,如果所有人都可以低门槛的创造生活视频,那么每天的供给将是海量的、不可想象的。
举个例子,我作为一个经常刷抖音不发抖音的人,使用 Sora 之后,还是忍不住发了几十条视频,还把部分视频下载下来,发在了朋友圈,互动量非常高。
这样的供给情况下,承载这些内容的,不一定就是旧产品的形态,
还有更多的路径值得我们探索。
前进吧,朋友们
sora2爆火,我看到的除了各种搞笑视频获取流量,已经有开发者或者商家开始使用对应sora接口,他们可能都是用的sora的,就可以圈钱了,生成各种本地产品介绍,看效果确实牛,科技的进步,视频的进步,AI的进步,确实会赋能一些行业;经过这么多,感觉行业+AI一定是可以挣到钱的,关键是同一个工具,有的人用来娱乐,有的人用来制作工作流,有的人赋能本行业,有的人却把它做成一个工具,赚更多人的钱!我相信AI会越来越强大,但是我们如何使用才是更关键的视频,sora很强,我们国内的可灵,即梦AI都在努力追赶!关键是我们普通人,思考如何使用这些工具做出一个对用户有价值的产品出来!
举个栗子:sora爆火,但是有水印,那我们做一个去水印的工具,也是很香的,你们知道有多少这样的工具???
sora在大部分的视频生成工具来说,我觉得是最好的一个了,可以生成各类的视频,比如带货视频,搞笑视频,科普视频等等。一些视频生成工具也会调用sora的api接口。但是sora现在越来越严格,开始了手机验证,这个就有点麻烦,现在官网的额度也没有之前那么多了。用sora的话,调用api会好一点。
它是个能让你开眼界的“神奇玩具”,但目前还不是个趁手的“生产力工具”。
最惊喜的是它的真实感。你描述一个场景,它不仅能生成流畅高清的画面,还能配上同步的声音,比如雨滴打在叶子上不同位置的声响,非常逼真。它甚至能理解物理规则,比如模拟篮球弹框而出这样“合理的失败”。
但实际的生成过程,更像是在“抽卡”。你需要不停尝试提示词,才可能得到一个可用的视频,成功率可能只有5%-10%。而且它限制很多:视频很短(普通用户10秒左右),生成特定人物或品牌内容常被拒绝,蛋疼的是,绝大部分用户玩几次新鲜感就过了,两个月后的留存率接近0%
这一票是投给 Sora 的技术能力和合拍的玩法的。
但一觉起来发现有不少媒体在说这玩意是 AI 抖音,我笑了,要不看看 @AI 抖音 在降临派上的分数 hh。
字节自己都没法没用 AI 重塑抖音。
为什么短视频有能上瘾?
我个人理解有两点:新,有趣
新,包含 内容新(Lks 的各种策划、影视飓风的亿点点不一样等) 和 形态新(交互视频、航拍视频、VR 视频)等
不同创作者用不同的视角带来不同的内容观点,不同的技术带来不同的内容体验
新,能激发用户的探索欲,能让用户点进来。
有趣,则是让用户继续看下去,比如三十六贱笑的对对子系列,看似无厘头,但是环环相扣,还带有对社会现象的思考。
当然有趣的内容还有很多,我就不一一列举了。
这两个点都与视频是否为 AI 生成无关,那么为什么各个平台不太喜欢 AI 生成的内容呢?
因为前两年的粗制滥造形成了一个刻板印象,AI 生成的内容 = 劣质内容
(透露一下,降临派纪委也会删除一些纯 AI 生成的查评,平台鼓励用户发表自己的真实观点,查友们之间友好讨论)
用户下意识的认为,这玩意这么垃圾,不会是 AI 做的吧?这个平台上内容都是 AI 生成的,不来了不来了( @独响 是另一个形态不同的理念,不在这个范围内,别误会了 hhh)
用户和平台只在意内容是否优质,不在乎内容是如何生成。
在内容生产上,Sora2 或许可以成功。
但 OpenAI 是想利用 Sora2 去做内容社交,可能有点难。
内容生产领域可能来了个王者,但在内容社交领域只是无足轻重的小虾米。
用户关注一个创作者,归根结底,是慕强心理。
我觉得 TA 的内容比我好,我觉得 TA 的见解比我高,我觉得 TA 的眼界比我开阔,
一定有一个势能才会有关注的欲望。
所以,2016 年抖音最火的是技术流博主。
如果 AI 生成内容技术蒸蒸日上,让大家都在一个起跑线,无论什么 Prompt 都能获得不错的内容,
那我想看什么,让 AI 生成不就好了嘛,还要关注别人做什么?
那社区何来,社交何来?
这里可能有个冲突 hhh
个人感觉 青蛙哥 的观点比我好,可以去查阅一下:Sora 2 真的很好,但用户真的不需要另一个 AI 抖音
另外瓜棚也可以领取 Sora2 的邀请码,欢迎在讨论区传递。
(一大早起来还有点迷迷糊糊,想到哪句写哪句,原先写了一半不小心按错键了全没了重新写,部分地方可能逻辑不通表达不清请见谅,欢迎在查评区和讨论区友好讨论)。
1.现在的社交媒体越来越偏离其初衷,不再是连接朋友与家人,而是算法主导的、无休止的“信息流”,sora2的产品设计更像是回归社交本身。
2.sora2一个用户可以有4个邀请码,一旦被使用,就会自动关注邀请对象,形成初始社交关系网,使用“Cameo”(客串)生成自己的ip作品
3.音画同步的视频生成效果,更符合物理规律,模型能力暂时领先veo3,国内的模型可能3个月左右可以赶上
4.sora2一致性和物理问题暂未彻底解决,中文支持能力弱,对于AI视频的创作门槛大幅降低
5.感觉sora2更偏向引导用户用AI视频来社交,不是作为专业AI视频的创作平台,sora2这次不在追求生成时长和画质,先积累用户再迭代
初代玩法就是恶搞sam哈哈哈哈~邀请码自取:「9S8HGN」
Cameo 的合拍玩法和邀请码裂变,都是给 Sora 2 宣发做的嫁衣,根本不会有什么 AI 抖音,OpenAI 也不会颠覆 TikTok,只能说会营销的 Sam Altman 还是保守了,没上砍一刀。
其他完整观点 ? Sora 很好,但用户真的不需要另一个 AI 抖音:https://mp.weixin.qq.com/s/9s1XjFCqf3XZ8XKU8XTe5w
我判断26年一定会出现的趋势是:随着技术迭代、用户接受度提升与分发渠道助力,2026 年 AI 视频内容将在大众日常内容消费中的占比显著提升。做出这一判断的依据来源于对内容供给侧、内容消费侧和渠道分发侧的分析。
内容供给侧:技术突破打破门槛,普通人制作高质量AI视频成为可能
AI 视频的爆发,首先源于生产端的技术革新。2024 年初 OpenAI 发布 Sora 视频模型,正式点燃了 AI 视频领域的探索热潮。作为 2024 年 8 月进入 AI 产品经理行业、深耕 AI 视频生产工具设计的从业者,我亲历了行业早期的 “高门槛困境”:2024 年 Q3 至 Q4,虽涌现出 Runway、Pika、Pixverse(国外)及可灵、即梦(国内)等一批 AI 视频产品,但高质量内容的制作高度依赖专业团队 —— 从脚本撰写、图像优化、视频渲染,到配音匹配、后期剪辑,每一步都需投入大量精力,普通用户几乎无法快速制作出有趣的 AI 视频。这直接导致当时 AI 视频未形成广泛传播,应用场景也局限于宣传片、广告、动画、营销素材等 B 端领域,大众参与感极低。
但 2025 年 10 月 Sora App 的发布,改写了 AI 视频的生产逻辑:用户仅需简单提示词,就能生成场景丰富、配音完整、转场自然、画面一致性极强的高质量视频。这一变化标志着 AI 视频生成技术进入 “低门槛时代”—— 按照技术迭代速度推算,到 2026 年,AI 视频制作将实现 “几乎无门槛”,普通用户无需专业技能,就能将创意转化为优质内容,“人人皆为 AI 视频创作者” 将从概念变为现实。
内容消费侧:人们对AI视频内容的接受度不断提高。
生产端的突破,还需消费端的认可作为支撑,而当前市场已显现出明确的 “接受度升级” 信号。2025 年 Sora App 生成的视频,在小红书、抖音等平台引发了 AI 视频领域的 “第二次大规模传播”(第一次为 2024 年初 Sora 模型发布时)。从平台数据来看,这类内容的播放量、互动率均表现亮眼,说明用户愿意为有趣、新颖的 AI 视频停留,甚至主动分享,本能性的抵触情绪显著减弱。
这种变化在身边场景中也能直观感知:身边不少同学主动讨论 Sora App,将观看其生成的内容描述为 “aha moment”,足见 AI 视频已从 “技术概念” 走向 “生活兴趣”。与此同时,相关部门也在推进政策的完善:2025 年 3 月我国颁布《人工智能生成合成内容标识办法》,通过强化 AI 技术透明化、提升风险管控水平,有效消除了用户对 “AI 内容真实性” 的顾虑,为大众接受 AI 视频奠定了制度基础。
按照这一趋势,再过半年(即 2026 年初),随着 AI 视频质量进一步提升、政策体系进一步完善、用户消费习惯进一步养成,AI 视频将会摆脱 “小众内容” 标签,在大众日常消费内容的比例中显著上升。
分发渠道侧:依靠大的内容平台,AI视频的传播有天然的优势。
AI 视频的爆发,还离不开分发渠道的 “天然优势” 加持。小红书、抖音等主流内容平台,本质上是 “视觉内容友好型平台”—— 这类平台的算法推荐机制、用户浏览习惯,都更倾向于扶持画面精美、创意新颖的视觉内容。而 AI 视频恰好契合这一特性:一旦出现好玩、有趣的 AI 视频,就能借助平台的流量分发能力快速扩散,形成 “创作 - 传播 - 再创作” 的正向循环,进而产生规模效应。
这种渠道优势,将在 2026 年进一步放大:一方面,各大平台会因 AI 视频的高互动性,加大对这类内容的扶持力度,使其在内容流中的占比持续提升;另一方面,低门槛的创作工具 + 高流量的分发渠道,会激励更多普通用户参与创作 —— 每个人都能将自己的想法、创意通过 AI 视频呈现,再通过平台触达更多受众,获得认可与反馈。最终,AI 视频(及更广义的 AI 视觉内容,如 AI 图片)将在 2026 年实现 “创作端” 与 “消费端” 的双向爆发,成为渗透大众生活的核心内容形态。
因此,我觉得AI视频内容将在26年迎来进一步的爆发,内容供给侧、消费侧以及分发渠道侧的发展现状和趋势注定了这个大趋势在26年一定会发生。
奥特曼已经被玩坏了,目前还不支持自定义导入形象,相信后面会开放类似定制数字人的功能。从准小白用户的视角看,语义理解能力很强大,写实类的人物口型声音理解到位,几乎没有翻车过,之前同类对口型等各种ai总会有各种问题。
一连出了8次视频,只有2次,对于人物对白,搞错了,张三的台词变成了李四的,其他整体没大的毛病,特别是生成仿真的街头采访视频,至于创意类的视频或许画面还有时候不是特别的惊艳。
长度有点短,分镜大概有5个左右,相信半年之后,ai的能力会继续突破。
后续社区化的引导应该可以是一个重点,感觉国内的快手可灵会很快赶上
Sora 2 确实是视频生成领域的一次重要突破 ,这次升级主要体现在几个关键方面,一个是物理准确性的大幅提升,另一个是指令遵循能力也大大提升,模型方面没啥多说的了,可以走开了外面该吹的吹,该骂的骂,毕竟不能满足每一个人的所有要求
最有趣的是官方在这个基础上用ai能力构建了一个新的app, Sora App 确实是一个大胆的尝试,但我认为这就是一个实验产品,目的只是用来试探市场,在 TikTok 面临美国业务不确定性的背景下,OpenAI 确实也看到了机会,也复制了 TikTok 的交互模式,但有一个根本区别在于所有内容都必须由 AI 生成,用户连上传一张照片都不行,这种 "纯 AI 生态" 的设计确实很有创意也包括里面的"Cameo"功能,但是 10 秒的视频时长限制确实让人有点无语,毕竟当前技术还不足以支撑更长内容的稳定性,视频越长 maybe 越容易出现逻辑错误
我反正是无法认可的,一个仅靠 AI 能力的产品在不考虑任何交互形式的情况下是绝对没有壁垒的,也不足以撼动 tiktok,当然我也提到了这毕竟是实验性产品,万一就成了呢 (毕竟我能力有限考虑不到所有场景),反正用速度卷起用户粘性我认为在这个场景是行不通的,不过值得关注的一点是模型厂商也开始下场做产品,这不是第一例,后续效果拭目以待hh
没有用软件。 但是用了sora2点API。效果令人惊艳。 虽然做不到 真人出镜视频那种。 但是通过简单画面描述和风格指定就足够生成一个流畅的画面。 缺点就是15秒时间太短,如果是对于一个完整的画面要求,好几个15秒判断就有点难保持人物一致性。 但是一次性几分钟成本又会过高。 希望open AI好好解决这个行业难题吧。
Sora可以一句话生成带背景音效和符合场景的对话,可以直接生成10秒广告短篇,大大提升创作效率和降低成本。无论是搞笑视频还是带货视频都能使用一句话指令进行生成。
测试用sora2做产品推广视频,人物表情和内容匹配,配音也很强。每个视频9秒有点短,第二个视频有点接不上,需要考虑衔接处如何处理。中文输出有点问题,有时候会变英文。
总体来说,人物、动作、语言、配乐的视频效果很惊艳!能用上真提效!
目前都是GOOD?那我来第一个BAD吧~
刚打开就是满屏的小扎,还有一些熟悉的IP:比卡丘、麦当劳、海绵宝宝~
开始以为是语言和文化差异(不理解美式幽默),但细想是本身对这种AI所谓“创意”不感冒
作为AI抖音的路人甲,私以为当前的热度更多只是因为它是AI,而不是它生成的内容质量有多好,比如刷短视频,有趣的是别人的故事、搞笑的烂梗,有感觉是因为“活人感”,而AI扑面而来的只有“虚假”,完全提不起兴致
明确的是,OpenAI着急了,一个基础模型已经远远不能满足野心,也想插足现实世界的人类生活,比如先从消耗时间最多的短视频平台开始
一个暴论:AI未来甚至都可以取代人类大脑,但人会留下“心”,因为人需要灵魂和人格。
可以说是一个彻彻底底改变了短视频的形式的一个产品,sora2的诞生,其还原度,包括人物的语言、动作、表情等等,都是一绝。不够在对于提示词的识别上面,还是更适合英文提示词,使用中文提示词的话,可能会出现,识别不准确,或者强调讲中文,但是还是输出英文的情况。
1656
更新于 2026-05-06