讨论个技术问题：如何提取视频文稿的 Chapters？Chapters 就是像图 1 那样列出视频的主要话题，并且加上话题开始的时间戳。最简单的方式就是将完整 srt 格式的字幕文本扔进去，然后让 LLM 帮你完成任务，Claude 3 的 Haiku 这样的小模型就可以完成的不错，但是对上下文长度要求比较高，毕竟 1-2

发布时间: 2024-05-01 16:40:15

1分

数据加载中

2

1

0

讨论个技术问题：如何提取视频文稿的 Chapters？
Chapters 就是像图 1 那样列出视频的主要话题，并且加上话题开始的时间戳。
最简单的方式就是将完整 srt 格式的字幕文本扔进去，然后让 LLM 帮你完成任务，Claude 3 的 Haiku 这样的小模型就可以完成的不错，但是对上下文长度要求比较高，毕竟 1-2
IT技术
( twitter.com )

15天前由宝玉提交

讨论个技术问题：如何提取视频文稿的 Chapters？

Chapters 就是像图 1 那样列出视频的主要话题，并且加上话题开始的时间戳。

最简单的方式就是将完整 srt 格式的字幕文本扔进去，然后让 LLM 帮你完成任务，Claude 3 的 Haiku 这样的小模型就可以完成的不错，但是对上下文长度要求比较高，毕竟 1-2 小时的视频文稿长度可不小。

比如图 2 的 1 小时左右的字幕输入的 Token 数是 3 万左右，GPT-3.5 的 16K 都不够。

但我还看到过一种另类方案，就是按照标点符号将字幕拆分成句子，然后对每一个句子做 Embedding，然后对 Embedding 的结果做相似度比较，找出句子和前一个句子的相似度，如果不相似就可能是新话题的开始。

这个方案的优点就是不用担心文稿长度，成本很低，但最终效果并不算多好，毕竟仅仅靠句子的相似度，很容易错判。

不知道你有什么更好的方法吗？

点击图片查看原图

点击图片查看原图

评论加载中...

您可能感兴趣的：更多

1

2

1

1

人上了网，总爱讨论态度、观点，少有人讨论技术问题——怎么解决问题、磨练工作生活的经验技能……不要变成这样的人。
人生活中大多数的问题，本质上都是技术问题。多关注如何解决问题，才是通往幸福之路。
推特中文圈
( twitter.com)

1年前 • 章工GPT • -- 点击 0 评论

2

2

1

1

来讨论点塔学高级话题：王局的视频在国内平台是发不了的，但是把视频去掉的录音+字幕版没问题。那么假如我们通过AI技术把王局的头换成胡锡进的，行不行？或者AI生成一个不是王局但是神似王局的虚拟角色，行不行？
时政
( twitter.com)

2个月前 • 象牙山刘能 • -- 点击 0 评论

3

2

1

1

PDFTriage：PDF分诊技术

该技术由斯坦福大学和Adobe 研究团队共同开发，主要解决了ChatGPT在处理长篇、结构复杂的文档（如PDF、网页、演示文稿等）时遇到理解不全或回答问题不准确的问题。…
IT技术
( twitter.com)

7个月前 • 小互 • -- 点击 0 评论

4

2

1

1

请问这个视频的中文配音都是AI翻译的吗？如果是的话用的是哪家的TTS技术呀？

来源：
IT技术
( weibo.com)

7个月前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:01:23

5

2

1

1

今天朋友群里分享了个Prompt技巧，来源于谷歌Deepmind在10月9日提交的一篇论文。

论文下载地址：

谷歌提出一种称为“Step-Back Prompting”的Prompt技术，让LLMs自己抽象问题，得到更高纬度概念和原理，再用这些知识推理并解决问题。…
IT技术
( arxiv.org)

6个月前 • 向阳乔木 • -- 点击 0 评论

6

2

1

1

#向开源项目学习 Glarity这款浏览器插件最近很火，花了2个小时翻了源代码。我比较好奇的是：
1，如何提取文章内容
2，如何解决大量文本内容的摘要问题
3，如何做的推广
下面尝试回答这几个问题：
推特中文圈
( twitter.com)

1年前 • balconychy • -- 点击 0 评论

7

2

1

1

如果一个男的开始在社交网站上讨论女权问题。

很快他就会发现，他基本上只能发表取悦女性的观点。

如若不然，马上就会有网友过来教育他：所以你还是从男性视角出发看待问题。

所以，如果一个男的可以长期讨论女权问题还不被喷退网，说明他…
推特中文圈
( twitter.com)

1年前 • 象牙山刘能 • -- 点击 0 评论

8

2

1

1

今天借助王局提出的这个话题延伸讲一下美国高校录取的一些情况和问题。

1，正如王局所讲的，中国的高考存在地区配额不平等问题。不过讨论的范围局限于哪个地区应该有多少配额才合理，基本没有讨论是否要彻底消除配额的问题。因为中国各个地区教…
推特中文圈
( twitter.com)

10个月前 • 蔡子博士Chris • -- 点击 0 评论

9

2

1

1

使用Gradio构建生成式AI应用5：图文互生游戏

视频描述：
在这个视频中，我们会利用之前学到的知识，如文字转图像和图像提取文字，来创建一个互动游戏。通过 Gradio，我们之前学习了如何为 NLP…
IT技术
( twitter.com)

6个月前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:04:42