技术人员
一、培训收益
课程中通过细致讲解,使学员掌握该技术的本质。具体收益包括:
1.掌握NLP基础;
2.关键词提取与文本分类方法
3.文本向量化与句法分析方法
4.NLP与深度学习技术的相应算法;
5.理解并掌握Tensorflow框架。
二、培训特色
本次培训从实战的角度对自然语言处理(NLP)进行了全面的剖析,并结合实际案例分析和探讨NLP的应用场景,给NLP相关从业人员以指导和启迪。
三、授课大纲
第一天上午NLP入门与基础介绍(一)
1.NLP的基本概念
2.NLP的发展历程
3.NLP主要研究方向
1)句法语义分析
2)信息抽取
3)文本挖掘
4)机器翻译
5)信息检索
6)问答系统
7)对话系统
第一天下午NLP入门与基础介绍(二)
4.NLP的基础
1)分词
正向最大匹配算法
逆向最大匹配算法
双向最大匹配算法
基于N-gram语言模型的分词
基于HMM的分词方法
基于CRF的分词法法
2)文本基本处理
文本提取
正在表达式
本文统计
3)词性标注
基于最大熵的词性标注
基于统计最大概率输出词性
基于HMM词性标注
基于CRF的词性标注
4)命名实体识别
基于CRF的命名实体识别
5.案例
1)在线中文分词系统实战
2)命名实体识别接口开发
3)基于词性标注的关键词提取
第二天上午关键词提取与文本分类(一)
1.关键词提取概述
2.关键词提取算法
1)TF-IDF
2)LSA/LSI算法
3)PLSA算法
4)LDA算法
第二天下午关键词提取与文本分类(二)
3.文本分类算法
1)朴素贝叶斯
2)线性分类器
3)支持向量机
4)Bagging模型
5)Boosting模型
6)浅层神经网络
4.案例
1)新闻主题提取
2)新闻分类实战
第三天上午文本向量化与句法分析(一)
1.文本向量化概述
2.文本向量化常用算法
1)词袋算法
2)HashTF算法
3)Word2Vec算法
4)Glove算法
第三天下午文本向量化与句法分析(二)
3.句法分析概述
4.句法分析常用算法
1)PCFG算法
2)条件随机场算法
5.案例
1)文本情感分析的开发示例
2)基于依存句法分词的问句相似度计算
第四天上午NLP与深度学习(一)
1.深度学习概述
1)神经网络
2)损失函数
3)梯度下降
2.深度学习常用算法
1)CNN
2)RNN
3)GRU
4)LSTM
第四天下午NLP与深度学习(二)
3.Tensorflow框架学习
1)Tensorflow简介
2)Tensorflow安装
3)Tensorflow基础使用
图(graphs)
会话(session)
张量(tensor)
变量(Variable)
4)Tensorflow线性回归以及分类的简单使用
5)Tensorflow中各种优化器的介绍
4.案例
1)基于CNN的文本分类
2)基于RNN的歌词生成
3)基于LSTM的机器翻译
4)基于Seq2Seq的问答系统
第五天学习考核与业内经验交流
杨老师 国内重点大学计算机与信息技术学院副教授,北京理工大学计算机学院博士,主要研究方向:自然语文处理、NLP中文信息处理、计算机视觉、机器学习等,在研究领域发表SCI、核心期刊论文30余篇。是XX科技公司的创始人,主要研究方向:自然语文处理、NLP中文信息处理、计算机视觉、具有丰富的教学和实践经验,授课过程中理论与实践相结合,气氛活跃,深受广大学员喜爱。
杨老师 计算机博士,目前就职于中科院某研究所,长期从事深度学习与机器学习研究工作,在NLP与CV领域有很深造诣,主持多项科技专项,并带领团队深入一线研发并落地,XXX视频监控与分析系统、XXX舆情监控系统、XXX智能对话系统及 XXX森林防火无人机跟拍系统等。申请发明专利2项、部级科技进步二等奖一次,在SIGIR、CIKM及AAAI的国际会议发表多篇文章。
赵老师 计算机博士,目前主要研究方向包括电子推荐、智能决策和大数据分析等。主持国家自然科学基金2项、中国博士后科研基金、上海市浦江人才、IBM Shared University Research以及多项企业合作课题等项目。已在《管理科学学报》、《系统工程学报》、Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers等国内外刊物和学术会议发表论文90多篇,其中被SCI、EI收录40多篇。出版著作和教材《智能化的流程管理》、《客户智能》、《商务智能(第四版)》、《商务智能 数据分析的管理视角(第三版)》、《数据挖掘实用案例集》等多部。
邹老师 中国科学院副研究员,硕博期间主持研发大型行业建模软件,代码量100万行(从底层开发是考虑后期维护和产权)。负责软件所有内容:市场分析、算法选择与定制、代码实现;已在全国20多家科研或生产单位使用。成立中国科学院邹博人工智能研究中心(杭州站),在翔创、天识、睿客邦等公司担任技术顾问,研究方向机器学习、数据挖掘、计算几何,应用于大型气象设备的图像与文本挖掘、股票交易与预测、量子化学医药路径寻优、传统农资产品价格预测和决策等领域。2017年主持科研项目荣获国土资源科学技术一等奖。