基于深度学习的情感分析方法研究.docx
《基于深度学习的情感分析方法研究.docx》由会员分享,可在线阅读,更多相关《基于深度学习的情感分析方法研究.docx(8页珍藏版)》请在优知文库上搜索。
1、(98|78514)士21 1ADeJnUUe基于深度学习的情感分析方法研究作者:翟高粤来源:科学与财富2020年第29期ChartTitle9L4593.7579.718L567954.8L35lllllll图1基于影评数据集精度的模型比较摘要:目前,深度学习已经成为计算机视觉处理领域事实上的标准。由于它在图像处理方面的广泛普及和成功应用,几乎所有的其他领域的问题都在尝试通过深度学习找到其解决方案,在自然语言处理中的文本分析和语言建模也不例外。在情感分析中,识别用户在文本评论中隐藏的情感是一项具有挑战性的任务。在本文中,使用深度学习模型进行基于IMDB电影评论数据集的情感分析,将基于深度学习
2、的情感分析方法与其他传统机器学习方法进行比较,以评估模型的性能。实验结果表明,基于深度学习的神经网络模型在许多方面优于传统的机器学习方法。关键词:情感分析;深度学习;自然语言处理;LSTM;词嵌入中图分类号:TP183文献标识码:A。引言在解决机器学习问题上,深度学习已经被证明是非常成功的口。虽然这些深度学习算法并不能直接用来进行情感分析,但是深度学习在图像处理、语音处理和其他认知方面计算领域上的成功,促使人们正尝试把深度学习算法应用在语言处理,情感分析和意见挖掘上,但语言问题是非常复杂的,首先需要解决语言规则和语言如何表示等相关的问题。随着词嵌入模型word2vec的出现,深度学习已经开始应
3、用到包括情感分析在内的许多NLP任务中。在本文中,使用深度神经网络将用户的电影评论数据集分为正类和负类。为了评估建立的深度学习模型的性能,将模型与传统的朴素贝叶斯和逻辑回归方法进行比较,结果表明,用于情感分析的深度神经网络自然语言处理(NLP)模型不仅在准确率方面优于基础模型,而且在捕获隐藏情感方面优于基于统计概率的机器学习算法。在本文中,使用迁移学习方法并通过LSTM网络来进行情感分析,通过预训练word2vec模型把整个文档转换成向量表示,在训练过程中调整了神经网络的各种参数,通过权值初始化和优化,以获得在精度以及空间和时间复杂度方面的最佳性能。调优参数后,对IMDB数据集进行情感分析获得
4、的最佳性能为93.7%o1情感分析的研究情感分析通常被认为是一种分类任务,根据作者在文本中所表达的情感或情绪,将一段文本划分为若干类情感中的某一类。有许多机器学习算法可以应用于文本数据的极性学习,但它不能直接应用到文本本身,输入的文本需要转换成矩阵,矩阵中的元素代表文本的重要特性,转换成矩阵后,矩阵中的每一行对应于文本的n维特征向量,通过机器学习算法可以学习到文本数据的极性。目前有一些流行的特征选择算法,如BagofWords、Bagofn-grams或者TF-IDF等。这些方法只是简单地考虑了单词的统计量,而完全忽略了单词的顺序和上下文,而这些对单词的意义起着至关重要的作用。另外,因为词典的
5、尺寸都非常大,所以这些方法还会产生稀疏和高纬度的矩阵,导致计算精度下降。2情感分析的深度神经网络深度神经网络是一种包含许多隐藏层的人工神经网络2。最初的NLP的深度学习之旅从一个简单隐藏层的浅层神经网络开始。在理解文本中语言隐藏结构及其语义和句法关系的复杂性的过程中,神经网络中隐藏层的大小随着各种超参数不断增长,并进行微调以得到性能最佳的模型。神经网络中许多新的激活函数的成功应用,也为神经网络在解决语言问题方面的普及做出了重要贡献。特别是在自然语言处理中,深度学习在词性标注、机器翻译、语音识别、意见挖掘、文档摘要和问题回答等方面都非常成功。接下来本文介绍一下深度神经网络在自然语言处理中的关键技
6、术。2.1 词嵌入向量(Word-Embedding)向量空间模型在NLP历史上已经使用了很长时间,例如支持向量机(VSM),其中所有数据点都表示为VSM中的一个点,分类器必须学习最好的超平面,该超平面应该能够将数据点分类到两个单独的类中。利用这一原则的方法可以主要分为两类:基于计数的方法和预测方法。在基于神经网络的词向量表示模型中,国外作者提出了两种不同的模型,一种是CBOW模型,另一种是SKIP-GRAM模型。CBOW中目标词的训练是基于上下文进行的,而在SKIP-GRAM模型中,对于每个词,它的上下文的词是基于窗口大小来预测的。本文采用word2vec模型对影评文档进行矢量表示。word
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 深度 学习 情感 分析 方法 研究