开云电竞在线图片标题生成系统-毕业论文

  新闻资讯     |      2024-02-12 11:36

  开云电竞在线图片标题生成系统-毕业论文第一章:绪论。本章介绍了课题的研究背景及意义开云电竞、BitTorrent协议及典型的BitTorrent系统的组成、本文的主要工作及主要创新点开云电竞,最后介绍了本文的组织结构开云电竞

  第二章:图片标题生成器相关算法。本章详细介绍了图片标题生成系统所用到的相关算法,只有理解了这些算法,才能更好的设计系统。

  LeNet-5由Yann LeCun教授提出,这个神经网络模型充分考虑图像的相关性。LeNet-5结构的特点如下:

  1)每个卷积层包含三个部分:卷积(Conv)、池化(ave-pooling)、非线性激活函数(sigmoid)

  近年来开云电竞,伴随着计算机科学技术和信息科学技术的快速发展开云电竞,互联网发展进入了大数据时代。而在大数据时代中,数据的价值也变得越来越高。如何从大量无效数据中提取出有效数据变成了一个重要的任务。而对数据进行筛选的一个重要任务就是对数据进行预处理,即如何有效地对数据进行标注。因为对数据进行标注是管理和使用数据的一个重要前提。而在大量的数据中,图像数据是其中占比很大又处理较为困难的一类数据。本文的图片标题生成技术就是图像标注的另一种称呼。图片标题生成技术不仅能帮助人们管理无标记的图片,还能帮助有理解障碍的人理解图片的内容。

  第三章:相关技术简介。本章介绍所设计的系统所用到的核心技术,并将这些技术与其他技术进行对比。

  第四章:在线图片标题生成系统的需求分析及设计。本章对网站进行了可行性分析、需求分析和概要设计,通过这一章,我们可以了解系统的大概框架,为下一步具体实现做铺垫。

  第五章:在线图片标题生成系统的具体实现。本章介绍了在线图片标题生成系统的具体功能和实现所用到的相关代码。

  伴随着机器翻译和大数据的兴起,出现了图片标题生成技术的研究浪潮。使用较为准确的语句自动描述图像的内容是一项非常具有挑战性的任务,但是这项任务却可能有着巨大的影响和非常广泛的应用场所。例如,在幼儿教育领域可以帮助小孩子看图识字;在医疗生活领域可以帮助视觉障碍人士更好的理解图像的内容;在图像检索方面可以帮助标记出图像描述的内容方便检索。比起已经经过深入研究的图像分类或目标识别任务,这项任务显得更加困难,因此它也是目前是计算机视觉领域的主要焦点。

  本次毕业设计的目标是开发一个在线的图片标题生成系统。设计一个网站,实现上传图片并得到相应的自然语言描述。网站分为图片上传区开云电竞、结果展示区和意见反馈区。开发这样的一个在线图片标题生成系统,可以将现有的图片标题生成技术开云电竞,可视化的展现在大家面前。更加封装的实现图片到自然语言的转换开云电竞。同时可以收集一些人类对于所使用的图片标题生成技术的水准评价,为以后进一步优化系统提供帮助开云电竞

  2014年10月,百度研究院的Junhua Mao和Wei Xu等人提出了多模态循环神经网络模型,创造性地将深度卷积神经网络和深度循环神经网络结合起来用于解决图像标题生成和图像语句检索的相关问题。这也应该是第一个采用多模态循环神经网络架构的神经网络模型。

  2014年11月,谷歌的Vinyals等人提出了NIC(Neural Image Caption)模型开云电竞,该模型放弃了使用循环神经网络转而采用长短期记忆网络,同时在卷积神经网络部分采用了更好的技术。

  近些年来的许多研究工作都取得了巨大的发展,比如计算机视觉和自然语言的深层模型、图像-句子检索、为图像生成最新的句子描述。在这些发展的方法中,大多将图片标题生成看做检索任务。他们为句子和图像提取特征开云电竞,然后将这些特征相互映射开云电竞,存入到语义嵌入空间中。这些方法对给定的图像进行检索获得其映射的句子,或是对给定的句子进行检索已获得它所映射的图像。但是,这样的方法存在着很大的缺陷,即他们都只能用于查询图像标注数据集中已经存在的图像的句子描述。而在实际工作中,我们所遇到的更多情况都是对没有存入的图像、场景进行的处理。而卷积神经网络和循环神经网络相结合的模型,恰好可以较好的处理这种情况。

  本章首先重点介绍了图片标题生成技术的背景及其重大意义,接着介绍了在线图片标题生成系统的一些模块以及其功能,然后介绍了建立本系统所需要做的主要工作和本系统的一些创新点,最后介绍了目前图片标题生成技术存在的一些问题。

  伴随着机器翻译和大数据的兴起,出现了图片标题生成技术的研究浪潮开云电竞。使用较为准确的语句自动描述图像的内容是一项非常具有挑战性的任务,但是这项任务却可能有着巨大的影响和非常广泛的应用场所开云电竞。例如,在幼儿教育领域可以帮助小孩子看图识字;在医疗生活领域可以帮助视觉障碍人士更好的理解图像的内容;在图像检索方面可以帮助标记出图像描述的内容方便检索。比起已经经过深入研究的图像分类或目标识别任务开云电竞,这项任务显得更加困难,因此它也是目前是计算机视觉领域的主要焦点。

  1苏州大学本科生毕业设计论文本科毕业设计论文学院部计算机科学与技术学院题目在线级专业计算机科学与技术班级计科班学号1427405118姓名赵子聪指导老师李军辉职称副教授论文提交日期201851837目录前言1第一章绪论211研究背景212国内外的研究的发展213主要功能概述414本文组织结构4第二章图片标题生成器相关算法521用于特征提取的深度卷积神经网络5211lenet55212alexnet5213inceptionv3622用于训练语言模型的深度循环神经网络和长短期记忆网络

  AlexNet有5个卷积层和3个全连接层,其中移除任意一层都会降低最终的效果。比起其他的深度学习网络结构,AlexNet网络结构在图像分类中的错误率有着显著的降低。它之所以能有这么好的效果,是因为,首先开云电竞,它使用了非线性激活函数Relu,这种激活函数得到的SGD收敛速度会比其他激活函数如sigmoid快的多。其次,它使用了防止过于拟合的方法Dropout和Data augmentation。同时,它采用了拥有百万级ImageNet图像数据的大数据训练。最后它还用到了多GPU训练。它的网络结构如图2-2所示:

  本次毕业设计就是围绕这个诞生还没有多久在线图片标题生成技术,设计一个在线图片标题生成的相关网站。

  在本文中,我们首先大概的介绍了这个技术的背景和发展以及我们要设计的是一个怎样的网站。接着我们详细介绍了图片标题生成的相关算法和模型。然后,我们又对设计这样一个网站所需要的技术进行了具体的描述和对比,找到用于本次毕业设计的合适技术。然后再对具体构造网站进行了可行性和需求分析,并作出概要设计。之后,利用这些技术将网站的具体实施代码和相关功能和显示效果进行介绍。最后再总结本次毕业设计开云电竞,对进一步开发进行展望。

  在表1-1中,我们可以看到NIC模型的评分比起多模态循环神经网络的评分有了显著的提高。同时,随着对于循环神经网络和卷积神经网络的优化,更多更好的图标标题生成技术在出现。但是,比起人类的判断仍然有着较大的差距开云电竞。因为,通过这些技术生成的自然语言描述都是服务于人类的开云电竞

  虽然在很多的图像标注评价标准中,许多现在的模型在评分上与人类已经不相上下甚至有赶超趋势。比如在表1-2中根据谷歌发表的论文,我们可以看到当使用微软的coco数据集时,谷歌的NIC模型和人类的得分已经难分高下。但是将该模型所得到的自然语言描述给人类来评判时,我们发现现有的自动评价标准仍然存在着许多瑕疵和漏洞。这也意味着,图片标题生成技术目前仍然有着很大的改进空间。

  本章首先介绍了在线图片标题生成系统中所使用的图片标题生成器所用到的卷积神经网络开云电竞、循环神经网络算法以及它们的结合使用。接着介绍了我们所用到的一个基于tensorflow系统的图片标题生成器的相关功能及其原理。

  目前我们常用到的将卷积神经网络和循环神经网络相结合的模型中,卷积神经网络所起到的作用主要是用来提取图像的特征并将其传给循环神经网络进行训练。因此,对于卷积神经网络的选择,将很大程度影响到图片标题生成的效果。选择更复杂、效果更好的卷积神经网络,是改善图片标题生成结果的一个重要方式。接下来,将简单介绍两种常见的卷积神经网络模型。

  将卷积神经网络和循环神经网络结合的模型用于解决图像标题生成的问题的研究最早是从2014开始提出,在2015年开始对模型各部分组成上进行更多尝试与优化,到2016年的国际计算机视觉与模式识别会议上成为了一个热门的专题。在这个发展过程中,将卷积神经网络和循环神经网络结合的核心思路并没有发生变化,变化的是使用了更好更复杂的卷积神经网络模型开云电竞,效果更好的长短期记忆网络模型,图像特征输入到循环神经网络中的方式,以及更复合的特征输入等。

  本次毕业设计利用谷歌基于tensorflow的图片标题生成的开源程序,设计了一个基于Python程序的web网站,通过这个网站将如今已经拥有良好图片标题生成效果的图片标题生成技术展现出来,让更多人了解使用到这个技术。同时,这个网站可以帮助收集人工资料,为完善这项技术提供更多的参考。