V O C A L I Z E ™ 4用户反馈报告
随着人工智能(Artificial Intelligent,AI)技术和人工智能生成内容(AIGC)的热潮,AI模型正在实现轻量化、嵌入化。能够在更低配置的设备运行。BP基于开源模型,开发并优化了一款音频合成软件,在推广这个软件的过程中,使用到了统计分析学。现研究统计分析在本AI音频合成软件的应用。本论文聚焦于统计分析在该AI音频合成软件中的应用,特别是如何通过数据反馈的方法提升用户体验。随着AI技术的普及,音频合成软件在用户需求的多样性方面面临挑战。基于问卷星平台进行统计分析,通过对用户反馈数据的深入分析,识别了影响用户体验的关键因素,并提出了相应的改进措施。研究结果表明,统计分析能够有效指导软件的功能优化和用户界面设计,从而增强用户的满意度和使用粘性。
关键词:统计分析;用户体验;人工智能音乐软件;开源模型;数据反馈;功能优化;用户反馈
一、绪论
随着人工智能技术的飞速发展,音频合成软件在音乐创作、游戏音效和多媒体制作等领域得到了广泛应用。然而,尽管技术不断进步,用户体验依然是决定软件成功与否的关键因素。用户对软件的满意度直接影响其使用频率和市场口碑,因此,提升用户体验已成为音频合成软件开发的重要目标。
在这一背景下,统计分析作为一种有效的数据处理和决策支持工具,开始在软件开发过程中扮演着越来越重要的角色。通过对用户行为数据、反馈信息和使用模式的系统分析,我们能够识别出影响用户体验的潜在因素,并据此制定相应的优化策略。尤其是在开源模型的基础上,我可以更灵活地调整软件功能,以满足用户的个性化需求。
在调研的过程中,本人采用了功能全面、行业主流的“问卷星”平台,并使用尽可能贴切的口语化、行业化语言表达,制作问卷,面向校内和网络社会开放调查。
二、音频合成软件现状
(一)当前市面上音频合成软件基本构成
在音乐等文化产业,始终被西方巨头、日本企业占据。我们并没有过大的话语权。
三大虚拟音色、音频合成软件 VOCALOID、Synthesizer V、UTAU,皆为日本制造。流行的欧美文化、日韩文化,其中难免夹杂恶意的文化入侵与对传统文化的“土化”诋毁、
1. VOCALOID
VOCALOID(ボーカロイド)是日本乐器制造商雅马哈公司开发的电子音乐制作语音合成软件。在软件中输入音调和歌词,就可以合成出原为人类声音的歌声。
2. Synthesizer V
Synthesizer V是Dreamtonics株式会社 旗下歌声合成软件,该软件介绍称,是站在歌声合成的前沿开发的一款歌声合成软件,支持Windows、macOS和Linux系统,且可作为VST插件使用
UTAU是一款由饴屋/菖蒲(あめや・あやめ)氏开发的免费的歌声合成软件,2010年1月份(v0.2.60版之后)改为共享软件。UTAU的正式名称为“歌声合成工具UTAU”,是在人力VOCALOID下诞生的产物。软件开发者为饴屋/菖蒲氏,于niconico动画上被称为饴屋。UTAU最大的特征,是使用自己或者他人录制的五十音或汉语音节等声音数据资料,在该软件数据库登录之后,便可用该声音合成歌曲,开发虚拟歌手。
4. 本人开发的纯国产音频合成软件VOCALIZE 4
经历过“汉芯”事件、买办坑自研 等无耻商业行为,直至2018年整个西方高新技术的封锁与攻关、舆论诋毁、针对华夏文化发源地、粮食重要产区--河南省的无尽地域黑,我们逐渐拨开云雾,看见真相。
近年来,国产芯片业逐渐壮大,在关键领域实现突破,极大地解决了重要芯片的供应,轻舟已过万重山。
无数青少年,对着那些外来的成功商业案例,羡慕着别人的品牌。
BP自成立以来,就总想(在合法范围内)搞点动静(Make Noice),并且要在多领域拥有自己的底牌。既然在传统赛道无法超越,那就在新的智能赛道实现。
借此,弘扬14亿人引以为豪的传统文化,在传统的礼、乐 与 现代科技、文化的交融下,让纯国产中文虚拟或真实的歌手在世界舞台发声,对外大功率输出。[1]
三、对用户意见的调查与统计分析
(一)调查范围
图1 调查范围
(二)用户对此类软件的了解程度与看法
在调查中,将近8成用户了解该类软件促生的文创产物。如图2所示。
图2了解程度
8成以上用户对该产业表示不反对。如图3所示。
图3用户看法
(三)用户对音频合成软件品牌和名称的了解度
根据用户对计算机音频合成软件的了解,如图4所示:
图4用户对软件的了解
(四)用户对音频合成软件及其主要产品子集--虚拟歌手的形象评价
用户认为,虚拟歌手的形象一定起到积极作用,超7成用户认为形象重要,并且超过半数用户认为,形象与歌手的属性比重一致。如图5所示。
图5用户对虚拟歌手形象的评价
(五)用户对虚拟歌手与作者之间的关系
作者认为,虚拟歌手及其声库,只是机械,而作者则是驾驶员,这辆车开得是否舒适平顺,与驾驶员有很大关系,即作者主导。但虚拟歌手自身的声音素质和参数也要达到标准,否则,再强大的作者也无法驾驭难以驯服的野兽。
用户也认为,作者的重要性更高,并且无人认为,虚拟歌手比作者更重要。
图6用户对虚拟歌手和作者之间的重要性对比
(六)用户认为虚拟歌手应当具备的功能
在三大基本要件:形象原画设计、声库、合成引擎软件的前提下,用户对多语种和语音歌声双输出的功能需求呼声最高。这将是本人优化软件的重点。同时,用户也希望虚拟歌手拥有多条声线、接入其他
AI模型进行智慧化部署。具体数据如图7所示。
图7用户对虚拟歌手功能的需求
四、根据调查结果,进行统计分析,得到优化方向
根据以上的调查结果,得知用户对音频合成软件的最大需求,就是可以作为语音输出,同时要具备多种语言,和多种语调、声线。对于热爱二次元文化的年轻人群,需要制作更高质量的角色形象,同时还可以制作相关文化产业,如实体周边等,带动经济发展。
在如今这个快节奏的时代,社会发展的逐步加速,难免会带来人与人之间的隔阂,使得人们疲于社交。此时电子设备和人工智能变成了人们排解情绪的出口,成为了一种精神寄托。
对于音频合成软件的扩展应用,可以在语音合成软件声库的基础上制作人工智能融合程序,成为每个人生活中锦上添花的情感支撑,提供一定的情绪价值。同时为软件带来更高的商业价值,提高用户的满意度和使用粘性。
五、结论
综上所述,借助网络统计分析,开发者可以很好地了解用户们的需求,根据用户们的反馈进行软件功能的提升,开发出用户喜欢、商业价值高、开发者乐于更新的良好网络社区氛围。
[1] BP VOCALIZE - the future speaking synthesizer - | 上线了sxl.cn. 社会责任感 基于开源模型的国产音频合成器. BPV.mysxl.cn,2024(10)