万能君的工具箱是网友开发的一款实用工具集合,其中包括批量音频转文字小工具,目前包括音频转文字、文字转语音、截图文字识别、批量图片文字识别、复制翻译、图种制作功能,支持批量选取音频转换,不限时长,免费!
需求分析
1、音频转文字:目前市面上的音频转文字大多收费。音频转文字的需求是:上传一段音频,直接识别成文字,对于会议记录的比较好使,注意不是实时的语音识别。
2、文字转语音:转的语音不要太生硬。
3、截图文字识别(OCR):截屏完成即可弹出截图所含图片中的文字。
4、批量图片文字识别:选择多张图片,直接识别出每张图片的文字。
5、复制翻译:看英文文献,有时候懒,如果能有置顶悬浮窗,实时监测剪切板,遇到想要翻译的段落,直接复制,即可给出多国语言翻译结果也是刚需;当然有些论文文本不能复制,所以还复用了截图OCR的功能,对OCR结果进行翻译。
6、图种制作:这个不入流,纯属个人爱好,没啥技术含量。
功能介绍
需求产生开发动力,基于百度AI和pyqt5制作了自己的小工具,解决了上述所有需求,需求也就就是功能了。
1、批量音频转文字
(1)比如批量识别小学生课文。
(2)比如识别长达五分钟的《荷塘月色》。
(3)识别岳云鹏的相声。
2、文字转语音
这个没什么好说的,输入文字,选择发音人、语速、音调之类的,可试听,可生产mp3格式的音频文件。
3、截图OCR
点击截图按钮即可截图,自动弹出识别文字。如下动图演示,也是个初版,界面简陋。
4、图片批量识别
在截图OCR下拉按钮有个图片批量文字识别功能,这都属于OCR功能,简单粗暴,批量选择图片,即可识别所有图片中的文字。如下动图演示:
5、复制翻译
看英文文献,有时候懒,如果能有置顶悬浮窗,实时监测剪切板,遇到想要翻译的段落,直接复制,即可给出多国语言翻译结果也是刚需;当然有些论文文本不能复制,所以还复用了截图OCR的功能,对OCR结果进行翻译。如下演示:
6、图种制作
没啥意思,就是将一张图和一个压缩文件合并成一个图片文件,这个生成的图片文件打开是一张图,如果后缀修改为zip,解压后就能看到原先的压缩文件,不做演示了。
软件操作
打开可能慢,且软件开启后带着cmd黑框。
使用须知
要有API Key、Secret Key,自己去百度注册获取,免费可以识别5万次哈。
更新日志
加入免费的音频转文字接口,免费的有普通话、英文、粤语、四川话识别,速度慢些,但准确率还可以。
杂类工具
杂类工具
杂类工具
杂类工具
杂类工具
杂类工具
EV录屏软件是一款功能全面的屏幕录制工具,支持高清、流畅的录制体验。EV录屏软件简单易用,用户只需几步操作即可开始录制。软件支持多种录制模式,满足不同场景的需求,如全屏录制、窗口录制等...
EV投屏是一款功能强大的投屏软件,支持电脑与手机、电视之间的屏幕共享,只需在同一局域网内,即可实现设备间的快速连接和屏幕共享。无论是办公远程操作、手机PPT投屏,还是娱乐时的手机投屏到...
api-ms-win-core-com-l1-1-0.dll文件是电脑系统中非常重要的组件之一。当该dll文件被删除、被移动到错误的位置,被电脑上的恶意软件更改,或者Windows注册表已损坏等,用户电脑就会出现api-ms-w...
Windows Terminal是微软自行开发的一款命令行终端工具,该工具功能强大,支持多标签页支持、富文本、多语言支持、窗口分割、可配置、主题和样式等,支持x86、x64和arm64,最低要求Windows 10 Bu...
弹弹play是将视频与弹幕相结合的影音播放工具,可以支持分析你的视频文件,将它与网络上的弹幕进行匹配,不管你看的是渣360p,还是高清1080p,它都能够帮你找到同一份弹幕,和所有观看此动画的...
腾讯文档是一款功能强大、易于使用的云端协同办公软件,它能够帮助用户快速高效地进行团队协作、文件管理、在线文档编辑等多种工作,提高团队协作效率和工作效率。同时有工作日报、会议纪要...
发表评论
共0条
评论就这些咯,让大家也知道你的独特见解
立即评论以上留言仅代表用户个人观点,不代表系统之家立场