加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

【重!磅!干!货

发布时间:2021-03-17 20:44:18 所属栏目:大数据 来源:网络整理
导读:副标题#e# 查看之前文章请点击右上角 ,关注并且 查看历史消息 ,还可以在文章最后评论留言。谢谢您的支持! 回复【文本挖掘】或者【点击阅读原文】获取链接与代码附录 一、 功能概述 ? ? ? ?关键词词频网络图是以股票论坛、 个股新闻、研究报告三个网站作

运行结果:

【重!磅!干!货


四、模块效率性能总汇

【重!磅!干!货

根据上表所示的各模块平均时间效率估计的结果,可以得到如下结论:
▲ 在三个数据源中,所有模块个股新闻的平均运行时间是最长的,研究报告次之,而股票 ? ? ?论坛是耗时最少的
▲ 所有模块的时间消耗主要都关键词的搜索上,模块的平均耗时和模块进行的关键词搜索 ? ? ?次数成正比
▲ 关键词词频模块 sigWordSeq 进行了一次词频检索,因此和检索模块SearchFiles 的平 ? ? ? ?均耗时相当
▲ 关键词网络模块 WordNet_stock 同样只进行了一次关键词检索,但是在计算关联股票 ? ? ? ?TF-IDF 指标是需要耗费一定的时间,因此平均耗时略长于单次的检索

▲ 关键词网络模块 WordNet 由于需要进行对 20 个一级词的搜索,因此耗费的时间是最长 ? ? ?的。另外, 由于三个数据源中【 个股新闻】的数据量最大,运行 WordNet 一旦遇到高 ? ? ?频词会消耗大量的时间,需要格外注意。

  • 本文基于光大文本挖掘系统框架概述全文。


【过往文章】

1.【机器学习课程】深度学习与神经网络系列之绪论介绍

2.【Python机器学习】系列之线性回归篇【深度详细】

3.多因子策略系列(一)——因子回溯测试的总体框架

4.Python机器学习:数据拟合与广义线性回归

5.【分级基金】之分级A的隐含收益率研究分析

6.【精华干货】Quant 需要哪些 Python 知识

7.【干货】量化投资国内外很棒的论坛网站

8.朴素贝叶斯模型(NBM)详解与在Matlab和Python里的具体应用

9.机器学习的前期入门汇总

10.【深度原创研究】分级基金下折全攻略(一)

11.【深度原创研究】分级基金下折全攻略(二)

12.【知识食粮】最新华尔街牛人必读书籍排行

13.通过 MATLAB 处理大数据

14.【扎实资料干货分享】Python、研究报告、计量经济学、投资书籍、R语言等!(Book+Video)

15.机器学习在统计套利中的应用

16.量化投资修行之路

17.统计套利在股指期货跨期套利中的应用:基于协整方法的估计

18.股指期货跨品种套利交易

19.沪港通股票统计套利:基于BP神经网络

20.机器学习到底在量化金融里哪些方面有应用?

21.【Matlab机器学习】之图像识别

22.【干货分享】Python数据结构与算法设计总结篇

23.基于Python的股票数据接口调用代码实例

24.基于Python爬取腾讯网的最热评论代码实例

25.卷积神经网络反向传播推导

26.深度学习项目


量化投资与机器学习

知识、能力、深度、专业

勤奋、天赋、耐得住寂寞

【重!磅!干!货

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读