正在进行安全检测...

发布时间:1714204210   来源:文档文库   
字号:
272Vol.27No.2JournalofBeijingInstituteofGraphicCommunication20192Feb.2019基于智能语音技术的读书笔记APP设计严志永北京印刷学院北京102600在阅读纸质书的过程中做笔记一直是一件比较麻烦的事情现有的方法并不能有效地解决这个问题本文提出了一种基于语音识别和语音合成这两种智能语音技术的读书笔记APP设计Android手机上的实现与测试表明该APP能够有效地帮助纸质书读者完成读书笔记记录工作关键词智能语音技术读书笔记APP中图分类号G202文献标志码A8626201902-0066-05文章编号1004-DOI:10.19461/j.cnki.1004-8626.2019.02.015引言在阅读纸质书的过程中做笔记对读者而言一直是一个比较麻烦的事情现有的若干在阅读过程中做笔记方法都会在一定程度上干扰读者的阅读进程虽然已有几款纸质书电子笔记APP对于这一状况的改善并不大这个问题在很大程度上影响了我国读者的阅读效率近年来人工智能中的智能语音技术的发展为解决这一问题带来了新的思路本文在分析现有制作纸质书读书笔记方法和提出了一种纸质书电子笔记APP功能的基础上基于语音识别和语音合成两种智能语音技术的读Android手机上实现了该APP书笔记APP设计并进行了初步测试足之处是容易对阅读过程造成干扰根据阅读心在阅读的初期需要从大脑的长期记忆中提理学因此阅读是一取大量的信息来完成对文本的理解个逐渐加速的过程当阅读进程被书写笔记打断因此读者有后需要重新从大脑中提取相关的信息时会在写完一段较长的笔记后努力去重拾自己的阅读思路在阅读后集中做笔记的好处是不会对不足是有些灵感已经消失了阅读过程造成干扰采用这种方式时读者有时会在阅读中发现自己非但在阅读告一段落后想做笔记时常感兴趣的内容却发现再也找不到相关的内容了直接在图书上做笔记的好处是不用携带笔记不足是笔记散布在多本书里要想集中利用很此外以后要想通过读书笔记来复习相关图书麻烦也基本不可能在笔记本上做笔记的好处是读书不足是将图书内容摘录到笔记笔记可以集中管理并且还会有抄写错本上是一个工作量巨大的工作误的问题做笔记的时间和空间方式的两两组合共有四但根据笔者的调查人们在读书过程中用种方式的最多的是阅读中在书上做笔记和阅读后在笔记阅读后在书上本上做笔记两种其他两种方式中阅读中做笔记会导致大量感想很可能已经被遗忘在笔记本上做笔记会因占用大量时间而对阅读过程造成干扰日本作家奥野宣之建议在阅读的过待到本次阅读结束时程中仅对图书内容进行标记再做笔记1现有制作纸质书读书笔记方法及相关APP分析1.读书笔记制作方法可以对于在阅读纸质书时做读书笔记的方式从时间和空间两个维度进行分析从时间角度而做读书笔记大体上有两种方式一种是在阅读一种是在阅读后集中做笔记过程中边读边记做读书笔记也大体上有两种方式空间角度而言一种是直接在图书上写自己的评论一种是在笔记本上摘录图书内容并书写自己的评论边读边记好处是容易抓住转瞬即逝的灵感11-28收稿日期2018-基金项目北京市社会科学基金研究基地项目16JDXCC007显然这种方法仅适用于自己拥有的
2严志永基于智能语音技术的读书笔记APP设计67图书在笔记本上做笔记涉及到将图书内容抄写到笔记本上的任务自己手工抄写并不是一个很好的主意在历史上曾出现过两种解决这个难题的方第一种方法是剪贴书页也就是把感兴趣的书页从图书上裁剪下来贴在笔记本上这样能保持图书的原貌欧洲人发明了保存和检索这种笔记条的笔记柜甚至有人建议同一本图书要买两个副2显然这种通过破坏图书来摘录内容的方式会带来极高的成本并且只能在自己拥有的图书上实施对于从图书馆借阅的图书就不能用这种办法目前这种方法还有流传就是人们经常对报纸进行裁剪得到剪贴报第二种方法比较有时代特欧洲的学者们在读书时会让秘书等人把自己感兴趣2显然这种方式不能原封不动地在当今社会实现这种方法似乎也需要有两本书一本学者自己持有阅读一本秘书持有用来抄录内容否则秘书拿过学者的书进行抄录也会影响学者的阅读进度笔记内容的主体是内容摘录和自己的评论例如奥野宣之所提倡的葱鲔火锅式笔记由五部分组成写读书笔记的日期书名作者名对自己来说重要的内容摘抄自己对这篇文章的感想评论其中日期是年月日的六位数字编码抄和评论用符号区分摘抄以起始评论以整个笔记完全靠手工书写完成2.辅助制作读书笔记的APP智能手机的出现为读书笔记的制作提供了一种新的方式在为纸质书做笔记方面出现了豆瓣笔记APP百度涂书笔记APP萝卜书摘APP和书入法APPAPPiReaderAPP当当读书APP等数字阅读APP也集成有电子书笔记功能豆瓣笔记APP百度涂书笔记APP萝卜书摘APP和书入法APP都提供了通过对书页拍照来裁剪书页的功能该功能能够快速摘录图书的内容不足之处在于图片会占用大量的存储空间这对于手机用户而言可并不是福音百度涂书笔APP萝卜书摘APP和书入法APP在此基础上提供了对图片进行光学字符识别OpticalCharacterRecognitionOCR来获取文字的功能这无疑将大大减少存储空间不过在读书的过程中一手持书,一手操作手机很难将书页压平因此图片中的书页都带有一定的弧度这在一定程度上降低了OCR的准确率这项功能往往需要读者对照图书对文字进行纠正从而大大降低了文字录入效率在录入评论时只能通过手动输入文字效率并不总之这类通过拍照制作笔记的APP操作较为复杂可能会打断读者的阅读进程目前并没有十分有效的办法来解决这个问题因此豆瓣笔记APP和百度涂书笔记APP都已被各自公司停止了支持数字阅读APP一般集成有笔记功能摘录文字时读者只需要用手指对文字进行选取即可读者输入自己的评论时仍会遇到输入法录入文字低效的问题用手指录入大量文字需要的时间并不短这将在很大程度上打断读者的阅读进程纸质书电子笔记APP和数字阅读APP都希望通过智能手机和移动互联网来减轻读者做读书笔记的压力目前来看并不完善继续改进需要技术的进一步发展APP设计对照麦克卢汉的媒介四元律提升过时现和逆转3罗伯特·洛根提出人工智能使解决问题的效能得到提升提升再现传说中的假再现4纸质书电子笔记APP和数字阅读APP都可以看作通过裁剪图书来获得图书内容的摘录即再现了历史上第一种摘录内容的方法文提出的基于智能语音技术的读书笔记APP则再现了历史上第二种摘录内容的方法即通过语音让秘书等人做内容摘录在深度学习技术的助力下语音识别技术有了快速发展目前主要的语音识别技术提供商科大讯飞等提供的语音识别工具都能达到97%的准确率读者在语音识别的过程中可以调整自己的语速语音使准确率达到自己满意的程因此本文提出使用智能语音技术来帮助读者做笔记并设计了一个基于智能语音技术的读书笔APP本节分别从笔记格式APP框架使用方式和APP技术难点四个方面对该APP进行描述1.笔记格式APP的笔记格式和其他APP类似笔记内容包括图书信息页码时间地点可选内容摘评论笔记标签图书信息包括书名作者出版社出版日期
682019可以采用扫描书后ISBN条形码然后从网上获取的方式来获得若干网站都提供了这种服务豆瓣网页码需要读者使用语音输入APP从读者的语音命令中提取页码然后插入到笔记中时间可以直接从手机读取地点可以从手机的定位系统获取不过由于这涉及到读者隐私需要读者的授权内容摘录需要读者使用语音来进行输入初需要读者依靠朗读输入大段文字虽然耗时较但读者在朗读的过程中也加深了对文本的印可能并不是坏事未来可以考虑在购买到图书版权的情况下服务器上存有内容的一份副本者只需说出X页第Y段从AB就可以完成对图书内容的摘录了评论也需要读者依靠语音输入这类似于读者的自言自语并不会在很大程度上干扰读者的阅读过程笔记标签由读者指定读者直接说标签为X就可以把该条笔记的标签设置为X从上述分析可知笔记包含内容虽然较多由于读者并不需要手动输入文字大量输入都是由语音完成因此效率很高对读者的阅读进程干扰不大2.APP框架APP的框架如图1所示1基于智能语音技术的读书笔记APP框架从图1可知APP由三个模块组成笔记管理模块智能语音模块交互响应模块笔记管理模块负责笔记的存储查询存储在本地的读书笔记会被及时传送到云端以便读者在多个设备上使用读书笔记可以通过多种方式来查询笔记如查询某一本书的笔记某一个标签的笔记等智能语音模块通过网络与智能语音服务器交互来实现语音识别语音合成交互响应模块负责响应读者的语音命令调用智能语音模块将语音命令识别成文本对文本进行解析根据提取的命令调用笔记管理模块或智能语音模块来完成相应的操作在上述APP框架中笔记管理模块由数据库操作和网络操作完成智能语音模块可以采用百SoftwareDevelopmentKitSDK交互响应模块需要对语音识别后的文本进行解析并提取其中的命令3.使用方式读者在使用这种基于智能语音技术的读书笔APP大量操作都是由语音交互完成手指操作并不多按照读书的顺序APP的使用方式如下1读书前在APP中定位到要阅读的图书以通过扫描书后ISBN条形码或者手动进行选取后续的操作都是在该书的笔记中进行2在阅读过程中需要做笔记时使用语音命做笔记即可创建一条新的笔记读者使用语音X输入页码通过朗读文本对图书的内容进行摘录使用语音来输入评论最后使用语音输入标签读书笔记的时间和地点可以通过读取智能手机的相关信息自动填入3当读者需要复习某书笔记时可以通过命复习X书的笔记来进行APP会逐条将读书笔记朗读出来此处使用语音合成技术来进行这样读者就可以听到自己在之前阅读时所作的笔记4读者还可以根据笔记标签来复习某类的笔记通过命令复习标签为X的笔记来进行APP会将该标签下的笔记逐条朗读出来5在读者的允许下APP可以根据时空情境向读者推荐读书笔记得到允许后将这些笔记朗读出来通过上述描述可知APP可以仅仅通过语音控制来完成所有操作这使得可以开发出相应版本部署在家里的智能音箱上这将为读者提供一个安静的读书环境从而在很大程度上排除智能手机对读者阅读的干扰如果仅仅使用语音命令来对该APP进行操对笔记的使用如复习也通过语音合成的方式输出那么就会将内容从视觉空间转换到声觉空
2严志永基于智能语音技术的读书笔记APP设计69这样最大的优势就是能够把双眼甚至双手从对智能手机的操作中解放出来笔记数据采用文一方面能够节省本形式存储而不是直接存储声音另一方面也有保护读者个人隐私方面的存储空间考虑4.APP的技术难点这种基于智能语音技术的读书笔记APP的技术难点在于对读者语音命令的理解一种方式是要求读者记住若干个语音命令会在很大程度上减轻APP开发的压力只需要设然后在语音识别后和这些关键词进计若干关键词行比对即可不过这无疑会加重读者的记忆负担这对于需要读者聚精会神的阅读过程而言显然会带来干扰另一种方式是允许读者以自由格式说然后使用自然语言处理NaturalLanguage出命令NLP中的意图识别IntentDetectionProcessing技术来挖掘出读者的意图这对于读者而言可以使读者可以沉浸在营造一个干扰较少的阅读环境阅读的快乐中但是对于APP开发而言则并不容虽然使用卷积神经网络ConvolutionalNeuralCNNNetworks循环神经网络RecurrentNeuralRNNNetworks但是这需要大量的语料进行训练对于一个新的APP而言并不现实本文实现的APP暂时采用了第一种方式先要求读者记住若干命令来对APP进行操作到以后积累大量语料之后再采用NLP的相关技术1文本来源及描述郦全M广西2016.240包含98个汉字和7个标点文本5来进行意图识别APP的实现与初步测试笔者在Android手机系统上实现了本文提出的基于智能语音技术的读书笔记APPAPP使智能语音服务器采用百度AndroidStudio开发在小米4手机Android6.0.1上进行语音API测试APP在两本图书上进行了测试测试文本及结果如表1所示第一段测试文本有98个汉识别错误的有5不过同音内隐地在我国某些地方被读成内隐的因此这两个错误可以忽略最终错误可以这样准确率为96.9%第二段测试被认定为3识别错误的有2错误率为文本有63个汉字96.8%语音识别对标点符号的判断错误较多一方面这并不影响对方面这对语音识别而言很难语音识别能够对比较专业文本的理解综上所述的图书内容表现出很好的识别效果本文还将语音输入的输入速度与智能手机上对比对象为搜的拼音输入法输入速度进行了对比狗输入法8.28搜狗输入法采用常用的九宫格两段测试文本的输入时间分别为2拼音输入界面52秒和140语音输入的时间分别为31秒和23搜狗输入法是语音输入用时的5.5语音输入有速4.3这表明相比于手动输入度上的优势测试文本及结果测试结果文化进化是人之为人所特有的他是心智创造和外化符号的结所以人的进化实际上就是一个人的心智与文化世界相互作用的计算过程人所卖画的符号化知识一类是以观念的形式存在另一类则内因的对象化在一定的物理系统上文化进化是人之为人所特有的它是心智创造和外化符号的结果所以人的进化实际上就是一个人的心智与文化世界相互作用的计算过程人所外化的符号化知识一类是以观念的形式存在另一类则内隐地对象化在一定的物理系统上将技术生物学和计算机连接到一起的两个重要概念是信息和进化我认要正确理解进化就必须借助信息的概念这是因为进化本质上就是积累信息约翰·梅菲尔德复杂的引M唐璐长沙湖南科学2018.2技术出版社包含63个汉字和6个标点将技术生物学和计算机连接到一起的两个重要概念是信息和这是进化我认为要正确理解进化就必须记住信息的概念因为进化本质上就是积累信息使用语音合成技术将笔记的内容读出来虽然但并不影响对内容的理解语音合语音比较生硬而中文的正成的朗读速度平均约为236/分钟6虽然前者仅是后者常阅读速度是309/分钟但也基本上满足了复习笔记的需要使76%用合成语音朗读笔记特别适合用户双手和双眼被占用的情况如在洗漱开车做饭时结语本文提出了一种基于智能语音技术的读书笔
702019APP设计期待再现历史上欧洲学者读书的情初步测试表Android手机上实现了该APP明这种APP对专业图书能够保持较高的语音识别如在图书馆语音交互既有优势也有若干不足等场合无法使用未来还需要对该APP进行进一开发与测试才能将其大范围推广来助力步的研究我国的全民阅读事业参考文献1奥野宣之如何有效阅读一本书超实用笔记读书法M张晶晶2016.南昌江西人民出版社2·布莱尔工具书的诞生近代以前的学术信息管2014.北京商务印书馆M徐波3埃里克·麦克卢汉弗兰克·秦格龙编麦克卢汉精粹M何道宽2000.南京南京大学出版社4罗伯特·洛根理解新媒介延伸麦克卢汉M2012.道宽上海复旦大学出版社5DengLiLiuYangEds.DeepLearninginNaturalLanguagePro-cessingMSpringerSingapore2018.6廖建桥1996张万山论中文的阅读速度J人类工效学138-41.责任编辑周宇DesignofReadingNoteAPPBasedonIntelligentSpeechTechnologyYANZhiyongBeijingInstituteofGraphicCommunicationBeijing102600ChinaAbstractIthasalwaysbeenatroublesomemattertotakenoteswhilereadingpaperbooks.Existingmethodscannotsolvethisproblemeffectively.ThispaperproposesadesignofareadingnoteAPPbasedontwokindsofintelligentspeechtechnologywhicharespeechrecognitionandspeechsynthesis.ItshowsthisAPPcanhelpreaderstakenoteseffectivelyafterimplementingandtestingitonanAndroidphone.KeywordsintelligentspeechtechnologyreadingnoteAPP

本文来源:https://www.2haoxitong.net/k/doc/27fb9ddb148884868762caaedd3383c4ba4cb4d4.html

《正在进行安全检测....doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式

相关推荐