端科技您的位置:首页 >通信 >

使用转录和AI驯服充满视频和音频的世界

要求任何记者说出他们真正讨厌的工作的一部分,大多数人会告诉你,这就是我现在正在做的事情 - 转录。

你不遗余力地讲述故事,但是你必须得到你刚刚收集到印刷页面上的金色字样。只有一种方法可以做到这一点,而这就是转录 - 这是一项繁琐的工作,它可以帮助你找到那些你努力工作的单词。

使用转录和AI驯服充满视频和音频的世界

有许多公司提供转录服务,但关键问题是准确性。

现在Trint是一家由经验丰富的许多外国战争老手所拥有的公司,他声称已经开发出一种方法,可以准确地将这些录制语音的文字直接打印到打印页面上。用户包括一些最大的媒体名称,如纽约时报,ABC新闻,汤森路透,AP,ESPN和BBC Worldwide。

据报道,Trint首席执行官Jeff Kofman解释了它是如何完成的。

网易科技:你是怎么第一个得到Trint的想法的?

科夫曼:我称自己是偶然的企业家。我作为一名广播记者花了三十多年的时间 - 一位来自40多个国家的外国记者。

实际上,我正在组建一个全球新闻计划并遇到一些在口语成绩单上做过有趣工作的开发人员。我说我花了一生的时间来抄写采访,演讲和会议,但随着演讲到文本越来越好,为什么不能为我做繁重的工作呢?他们不知道这个疯狂的记者是谁,但这个有趣的想法浮出水面。

这是那些灯泡时刻之一。我们想,为什么以前没有这样做过?这是在2013年左右,我们在2014年开始了Trint。我希望我可以说我是一个伟大的远见者,但我不知道技术是在这个伟大的时刻,当演讲到文本刚刚开始向前和上升阶段。

如果你在两年前尝试过,那就失败了。两年后,你会关注我们。如果你想到海洋上的冲浪者正在寻找形成的波浪,我们就会得到它正在形成的波浪。

我认为这是因为我遇到了问题。如果你没有住在问题中,那么你实际上并不知道有问题。我偶然发现它,但我可以看到我们原来的三个开发人员都在他们的东西上。回来的结果比我预期的要好。

我们的想法是,我们将文本 - 机器生成的成绩单和源音频 - 与口语单词对齐并准确地达到毫秒级,这样你就可以像卡拉OK那样跟随它,然后我们必须找到一种方法来纠正它。这就是真正有趣的地方。

我们所做的是,我们提出了将文本编辑器(如Word)合并到音频 - 视频播放器并创建一个具有两个非常不同功能的工具的想法。

这就是胜利的地方,我记得对这些家伙说 - 而且我认为他们认为我有点疯狂 - 这就是未来。要么我们聚在一起让这件事情发生,要么我们将在几年内走进咖啡馆,有人会开始研究一些我们刚刚设想的软件。

我说,我不会让这种情况发生。这实际上是说世界需要使口语可被发现。我们是一个视频,音频,播客和YouTube的世界。我们不再通过书面信件,通过文字说话了。我们通过音频和视频录制讲话。他们不可搜索。打印使它们可以搜索。

我们在这里得到一个时间表。你什么时候开始的?

好吧,在2014年初,它开始发芽,我们在14年秋天建立了公司,我们真的开始建设。我在报纸,电视,广播,网上安排了一些记者朋友的电话,我戴上了我的记者的帽子,并与世界各地的十几个团队一起做了这件事,以便工程师能够理解问题所在。我说,告诉我你怎么做笔记,你怎么找到内容,录音。每个人都说:“Omigod我讨厌抄录,这是我工作中最糟糕的部分。它总是一样的 - 听,停,打字;听,停,打字。如果你能给我们一条捷径,你就会表现出奇迹”。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。