您好,欢迎来到意榕旅游网。
搜索
您的当前位置:首页语音识别在电视字幕编辑中的应用

语音识别在电视字幕编辑中的应用

来源:意榕旅游网
实践应用语音识别在电视字幕编辑中的应用

徐涛 合肥市广播电视台

摘要:近年来,语音识别技术得到了飞速的发展,并被逐步应用到了越来越多的领域。本文以电视节目中的字幕制作为例,探讨如何利用语音识别技术,快速将电视节目后期编辑所用的同期声等语音转换为文字,提高字幕编辑效率。

关键词:语音识别 字幕编辑 电视制作字幕的制作是电视节目编辑中不可或缺的一部分,也是电视节目中重要的一个环节。传统电视节目字幕制作中,无论是采访中的同期声,还是对话访谈类节目,字幕编辑的前期工作都是要把语音内容转为文字,需要投入大量的时间在文本的编辑中。随着语音识别技术的迅速发展,语音识别效率及准确度也越来越高,我们可以利用语音识别,来配合电视节目字幕的制作,通过智能化字幕系统,把语音转换成文字之后,再复制到非编软件中,可以节省很多的电视节目制作时间。

1.1 语音识别的基本原理

语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模型库三个基本单元,它的基本结构如图1所示。

未知语音经过话筒变换成电信号后,在识别系统的输入端,首先经过预处理,再根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。而计算机在识别过程中要根据语音识别的模型,将存放的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板。然后根据此模板的定义,通过查表给出识别结果。显然,这种最优的结果与特征的选择、语音模型的好坏,以及模板是否准确都有

音等。方言是语言的地域变体,中国幅员辽阔,方言众多,因此需要用不同的声学模式来描述,只要拥有较多的用户语音数据,就能很好地解决这个问题。背景噪音,人多的公共场所产生的巨大的噪音对语音识别的影响很大,但在实际应用中,噪音又是无法避免的。2 电视节目中的字幕2.1 字幕的作用

相比画面来说,字幕则有更为清晰明确的表意优势,可以地表情达意,能够使电视画面要表达的更准确,所以字幕在电视制作中的有着不可替代的地位和作用。

1 语音识别技术语音识别技术是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别人类口述的语言,把语音信2.2 字幕的运用

在访谈类、晚会等节目的录制中,号转变为相应的文本或命令的高技术。着直接的关系。语音识别是一门涉及很广的交叉学科,1.2 语音识别技术的它与声学、语音学、语言学、信息理论、难点模式识别理论以及神经生物学等学科都有非常密切的关系。语音识别技术正逐步成为计算机信息处理技术中的关键技术,它的应用已经成为一个具有竞争性的新兴高技术产业。语音识别在翻译过程中的一些难点主要体现在语音“质量”上。

影响语音识别的因素有地域方言与背景噪

图1 语音识别系统

106

《有线电视技术》 2017年第8期 总第332期

《有线电视技术》 2017年第8期 总第332期

实践应用字幕是不可或缺的,但后期制作字幕的工作量很大。同期声是电视节目中最需要字幕的,字幕的内容包括记者和采访对象的谈话、现场的各种实况等。2.3 字幕的制作

图2 服务器架构

字幕的制作分为两个步骤,第一步是听写,第二步是拍打时间线。第一步工作相对耗时,需要记者、编辑等后期人员一边听语音,一边打字记录。比如在录制大型晚会、新闻类、访谈类、综艺类等节目时,由于同期声来源的语速、语调等问题,还需要后期人员花更多的时间和精力去辨听,占用了大量的时间。

3 语音识别在字幕编辑中的应用智能字幕系统是建立在语音识别技术之上的,我们针对电视台节目生产字幕编辑系统的特殊环境,在网络架构、系统集成以及用户界面上给予优化,使得在操作上更加快捷和方便。3.1 网络架构

智能字幕系统分为服务器端和客户端,服务器端部署在电视节目生产网之外,通过硬件防火墙与电视非编系统互联,确保电视非编系统的安全,防火墙只开放相应的端口与非编系统进行通信,进行语音转换服务。服务器架构如图2所示。

3.2 客户端

非编主机需要安装智能字幕系统的客户端软件,然后配置服务器地址,与服务器连接。客户端的主要功能就是将本地的语音传送到服务器,并接收服务器返回的翻译结果。客户端对语音的录制方式分为内录和外放。无

论是内录还是外放,客户端都会在识别的过程中同时录下语音,并与翻译后的文字进行一对一匹配。

(1)内录

内录是录制计算机内部声音,即计算机系统所发出的声音,包括使用非编软件播放的视频声音。电视节目编辑所需要的前期拍摄素材,都必须上传到非编网络中,其中记者采访素材中的声音需要进行转换,内录的作用就是把语音转换为文字。(2)外放

在直播或录制节目时,我们可以通过外放将通过麦克风的声音,直接转换为文字,以便字幕的后期制作。

3.3 字幕编辑

进行同期声字幕编辑时,采用客户端内录方式,启动智能字幕系统,然后打开非编软件播放采访的视频素材,进行语音文字转换,可以一边听一边对照转换后的文字,在有明显转换错误的地方作标记进行手动错字纠正,即可完成语音转换文字。再把文字复制到非编软件中,拍打时间线即可完成电视节目的字幕制作。4 智能字幕的现实意义实际应用中,我们使用的智能字幕系统并没有进行集成化处理,目的就是可以随时随地的使用它,不受各种环境的。在电视节目的制作中,需要的视频素材很多,像网络中的、手机中的以及其他各种剪辑后的视频等,但是在电视播出中,有些是必须要加上字幕的。智能字幕客户端,只要能连接到服务器,在任何一台电脑都可以使用。智能字幕系统不仅仅提升了记者、编辑在处理字幕编辑过程的工作效率,同时在一些大型的活动中、整场的节目中,可以提前把语音接入到智能字幕系统中,一边录制节目一边准备字幕文本,大大减少了后期制作字幕的时间。

从整个电视节目生产流程来说,智能字幕系统的投入使用,优化了节目生产流程。在过去,处理任何视频素材字幕的时候,都是人机同在,一边听一边打字,而现在完全可以实现人机分离,只要对转换完成的文字再进行一遍核对即可。

5 结束语在电视节目字幕编辑中使用语音识别技术,可直接把语音转换成文字,缩减了字幕制作时间,提高了工作效率。智能字幕系统的投入使用,可以让我们借助先进的技术优化传统电视节目的生产流程。随着语音识别底层技术的不断进步,相信智能字幕系统将会更加完善。同时,我们也希望能通过此系统的投入使用,带动更多的现代技术应用到我们的电视节目生产中去。参考文献

[1].浅谈语音识别技术的应用和发展[J].科技与传播,2009(9):22-23.CATV

107

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- yrrf.cn 版权所有 赣ICP备2024042794号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务