使用GDELT数据库-iteye

: 使用GDELT数据库 评分:

使用GDELT数据库使用GDELT数据库使用EGEDI数据库使用使用使用

GDELT 2018-04-27 上传大小：1359KB

所需: 42积分/C币立即下载

: streamline-hackathon-boilerplate:2018简化黑客马拉松样板
简化GDELT 1.0事件数据库的Hackathon样板该存储库包含用于Apache Flink和Apache Spark的样板Java / Scala代码，用于解析和流式传输GDELT 1.0事件数据库[1]。它还包括有关数据的简单聚合示例。运行样板（选项1）您可以从您最喜欢的IDE中运行代码。您只需要选择一个具有静态main方法的类作为入口点即可。无论使用Flink还是Spark，选定的处理引擎都将作为内部组件启动。建议将此方法用于开发和测试目的。运行样板（选项2）您应该将作业部署在计算机上启动的本地Flink / Spark群集上。为此，您首先需要通过在此存储库的根目录上执行来编译代码： mvn clean package Apache Flink 之后，您需要将作业提交给Flink Job Manager。请确保已在计算机上运行Flink的独立（或群集
立即下载
上传者： weixin_42102272 时间： 2021-05-09

: news_event_evolution:基于图网络模型的事件演化检测
news_event_evolution 基于图网络模型的事件演化检测在工作... 依赖关系和工具：抓取工具：： Tidy-html5：：文档图转换器： : Neo4J 2.0.4 Louvain方法：： Networkx，Numpy，Scipy，scikit-learn，pandas，py2neo 模块：下载文章：从事件数据库GDELT获取事件列表基于GDELT的sourceUrl从Internet爬网 Set startdate and enddata, archive directory, count of articles per day python download_article.py 修改后的XMLParser（来自原始版本）将文本文档转换为图形结构提取命名实体和Cvalue术语 Refer to Readme for
立即下载
上传者： weixin_42146888 时间： 2021-05-20

: elk-gdelt-tutorial:配置，脚本和过滤器，以获取分析著名的GDELT（http
ElasticSearch-LogStash-Kibana堆栈设置，用于处理GDELT文件配置，脚本和过滤器，以获取分析著名的GDELT（）数据集的ELK堆栈。除了用于GDELT数据文件格式的LogStash grok REGEX模式之外，还包括一个方便的Py脚本，用于在本地下载日期范围内的GDELT文件。 ELK设置应该可以在基本本地环境中以教程/开发目的工作，而无需进行任何配置。查看文档： LogStash配置启动LogStash时，您需要使用本地路径从此存储库中指定配置文件： ./logstash -f /ls-gdelt-pipeline.conf 如果您遇到问题并希望完全“重置” LogStash，则需要手动删除其“自”数据库...例如在Linux中： rm ~/.sincedb* 如果事情似乎无法正确处理
立即下载
上传者： weixin_42131424 时间： 2021-05-02

: Gdelt:Gdelt工具
格德尔特 Gdelt工具
立即下载
上传者： weixin_42134537 时间： 2021-05-07

: gdelt-conflict:GDELT冲突数据集1.0
GDELT冲突数据集1.0（2021）免责声明我将此数据集构建为个人项目。它没有任何保证。随意将其用于您自己的项目或文章，但请承认我。并记住要引用GDELT项目及其我将来可能会发布新版本，但不能保证。如果您分析数据，请告诉我。我很想看看你发现了什么。介绍该存储库记录了2021年GDELT冲突数据集的来源。可对世界各地的新闻媒体进行持续监控。它的档案可以追溯到1979年1月1日。该数据库据说每15分钟更新一次。他们的任务是“建立世界所有国家的人类社会规模的行为和信仰目录”。 GDELT冲突数据集利用GDELT来检查过去40年中冲突的演变。它汇总了1979年至2021年期间从258个国家的媒体报道中提取的超过8,300万个事件的信息。这些事件分为32个类别，描述了各种规模的冲突行为，例如“没收财产，进行自杀炸弹袭击”，“占领领土”。希望该数据集可以
立即下载
上传者： weixin_42116734 时间： 2021-04-11

: GDELT-Graphql-Analysis：使用GraphQL分析GDELT数据
GDELT-Graphql分析在这个项目中，我们正在使用GraphQL分析GDELT数据。 GDELT是一个免费的，不断更新的数据源，它每15分钟发布一次世界事件数据。该项目是通过以下方式完成的：里卡多[ ] Maxim [ ] 卡尔·古斯塔夫[ ] 该项目是塔尔图大学大数据管理课程的一部分。您可以在了解更多信息所需软件码头工人Python 3.5 Node.js 从头开始在本地运行项目此块中的所有命令应依次在各自的“终端”窗口中依次运行。启动Kafka集群和数据库 bash kafka_cluster.sh 启动卡夫卡制片人 bash producer.sh 启动卡夫卡消费者 bash consumer.sh 启动生产服务器 bash server.sh 运行开发服务器（在server.sh之后） nodemon src / server .
立即下载
上传者： weixin_42097369 时间： 2021-02-13

: 2018_Predicting Social Unrest Using GDELT.pdf
摘要：社会动荡是某些事件和社会因素造成社会普遍不满的负面后果。我们想利用机器学习（随机森林、助推和神经网络)的力量来解释和预测何时会发生巨大的社会动荡事件(巨大的社会动荡事件是维基百科页面“美国内乱事件清单”所承认的重大社会动荡事件）。我们审查并发现，在一次此类事件----桑德拉·布兰德的死亡----以及随后发生重大内乱的其他类似事件之后，以负面情绪发表的新闻文章数量有所增加。我们使用从谷歌的GDELT（全球事件、语言和音调数据库）表中获取的新闻文章作为一种媒介，研究导致美利坚合众国州和县两级大规模动乱的社会因素和事件。为了能够识别和预测县一级的社会动荡，可以部署方案/应用程序来抵消其不利影响。本文试图解决这一任务，即识别、理解和预测何时可能发生社会动荡。关键词：社会动荡·新闻媒体·GDELT·主题·事件·随机森林·阿达促进随机森林·LSTM
立即下载
上传者： weixin_40651515 时间： 2020-04-09

: GDELT_Intro:有关GDELT入门的快速教程
GDELT入门一些有关使用“事件，位置和音调的全局数据”的快速教程。在NBViewer中查看 2015年更新，您无需下载任何内容即可立即分析数据集。检查一些资源：。。。
立即下载
上传者： weixin_42137032 时间： 2021-04-27

: gdeltevent数据字段说明V2.docx
gdelt
立即下载
上传者： weixin_43398156 时间： 2021-01-27

: gdeltPyR:基于Python的框架检索事件，语言和音调的全球数据库（GDELT）版本1.0和版本2.0数据
Linux and Mac OS Windows OS Module Version Coverage Downloads gdeltPyR gdeltPyR是一个基于Python的框架，用于访问和分析Python Pandas或R数据数据。用户可以输入单个日期，日期范围（两个字符串的列表）或单个日期（列表中的两个以上），并返回。 Python 2即将退休。因为gdeltPyR依赖于将终止对Python 2支持的几个库，所以谨慎地做同样的事情。在接下来的几个月中，Python 2中的gdeltPyR功能将变得有问题。移至Python 3以获得最佳体验。 gdeltPyR通过检索，并将提供一种的方法。因此，您拥有的内核越多，提取更多数据所需的时间就越少。此外，您拥有更多的RAM，您可以拉取更多的数据。最后，对于RAM受限的工作流，创建一个用于提取数据，写入磁盘和
立即下载
上传者： weixin_42104947 时间： 2021-05-10

: 新闻快讯：R中使用Internet存档和GDELT Television Explorer的工具
新闻快讯：R中使用Internet存档和GDELT Television Explorer的工具
立即下载
上传者： weixin_42139460 时间： 2021-02-05

: geo-news:使用GDELT API收集并使用Leaflet.js显示的与关键字相关的最新新闻的热图
地理新闻一个使用GDELT API在地图上直观显示当前新闻趋势的项目（使用leaflet.js）。
立即下载
上传者： weixin_42114041 时间： 2021-05-12

: public_datasets
public_datasets
立即下载
上传者： weixin_42121754 时间： 2021-04-02

: 数据库的使用
使用ADO数据库进行数据的读取、存储、删除、插入操作。
立即下载
上传者： fan2036077 时间： 2013-07-19

: 数据库使用
要使用数据库首先要创建数据库用户啦，如果不想要它当然就删除啦，所以看看这个教程吧
立即下载
上传者： u012875437 时间： 2014-05-10

: OCTCMG:一类文字收藏
重庆奥组委 MarcosGôlo的一类课文集资讯资讯这些一类文本集合由GDELT项目（全球事件，语言和音调数据库）的新闻标题组成。根据IPTC（国际新闻电信理事会）的分类标准，选择了与每个文本集有关的主题。该项目GDELT可以在这里找到和所有IPTC主题。通过检查新闻标题中是否包含该主题来收集新闻。返回少于4000个新闻项的主题不被视为文本集合。为所有文本集定义了6000个新闻项的限制。最终，获得了183个文本集。如何使用！pip安装git + 从OneClassTextCollectionsLibrary导入数据集中 datasets_dictionary = datasets.load（）每个文本集合的数据框== datasets_dictionary [基本名称] 新闻ID 新闻日期新闻标题每个文字集的主题 -餐厅-歌剧-员工-物流-进口-洪水-关
立即下载
上传者： weixin_42133753 时间： 2021-04-06

: GDELT-Event_Codebook
GDELT-Event_Codebook 介绍gdelt 事件 GDELT-Event_Codebook V2
立即下载
上传者： weixin_44197307 时间： 2018-12-20

: gdeltDataAcquisition:一个简单的Python脚本，用于过滤和获取来自GDELT项目事件数据库的数据
GDELT数据采集一个简单的Python脚本即可从（该数据集是理解全球人类社会的最大的开放数据集）中获取数据的，它用152种语言提供了跨越200年的总计8.1万亿个数据点。事件数据库包含超过25亿条记录，这些记录按数据组织成一组由制表符分隔的文件。到2013年3月31日，记录将在活动发生之日以月度和年度文件存储。从2013年4月1日开始，每天都会创建文件，并按照事件在世界新闻媒体中发现的日期（而不是事件发生的日期）存储记录。我们的重点是该数据库的1.0版，该数据库每天都会在更新为一个新条目。描述该脚本从GDELT项目事件数据库v1.0原始数据中提取事件的数据集，并使用CAMEO分类法按所需事件类型进行过滤，并使用FIPS 10-4国家/地区代码对所需采取行动的国家/地区进行过滤。给定的输出是一个逗号分隔的值文件，其中包含给定事件和国家集的已标识事件。依存关系该脚本在
立即下载
上传者： weixin_42181693 时间： 2021-03-29

热门资源标签

上传资源赚钱

Global site tag (gtag.js) - Google Analytics