docx文件

使用GDELT数据库 评分:

使用GDELT数据库使用GDELT数据库使用EGEDI数据库使用使用使用
2018-04-27 上传 大小:1359KB
立即下载
zip文件
streamline-hackathon-boilerplate:2018简化黑客马拉松样板

简化GDELT 1.0事件数据库的Hackathon样板 该存储库包含用于Apache Flink和Apache Spark的样板Java / Scala代码,用于解析和流式传输GDELT 1.0事件数据库[1]。 它还包括有关数据的简单聚合示例。 运行样板(选项1) 您可以从您最喜欢的IDE中运行代码。 您只需要选择一个具有静态main方法的类作为入口点即可。 无论使用Flink还是Spark,选定的处理引擎都将作为内部组件启动。 建议将此方法用于开发和测试目的。 运行样板(选项2) 您应该将作业部署在计算机上启动的本地Flink / Spark群集上。 为此,您首先需要通过在此存储库的根目录上执行来编译代码: mvn clean package Apache Flink 之后,您需要将作业提交给Flink Job Manager。 请确保已在计算机上运行Flink的独立(或群集

立即下载
zip文件
news_event_evolution:基于图网络模型的事件演化检测

news_event_evolution 基于图网络模型的事件演化检测 在工作... 依赖关系和工具: 抓取工具: : Tidy-html5: : 文档图转换器: : Neo4J 2.0.4 Louvain方法: : Networkx,Numpy,Scipy,scikit-learn,pandas,py2neo 模块: 下载文章: 从事件数据库GDELT获取事件列表 基于GDELT的sourceUrl从Internet爬网 Set startdate and enddata, archive directory, count of articles per day python download_article.py 修改后的XMLParser(来自原始版本) 将文本文档转换为图形结构 提取命名实体和Cvalue术语 Refer to Readme for

立即下载
zip文件
elk-gdelt-tutorial:配置,脚本和过滤器,以获取分析著名的GDELT(http

ElasticSearch-LogStash-Kibana堆栈设置,用于处理GDELT文件 配置,脚本和过滤器,以获取分析著名的GDELT( )数据集的ELK堆栈。 除了用于GDELT数据文件格式的LogStash grok REGEX模式之外,还包括一个方便的Py脚本,用于在本地下载日期范围内的GDELT文件。 ELK设置 应该可以在基本本地环境中以教程/开发目的工作,而无需进行任何配置。 查看文档: LogStash配置 启动LogStash时,您需要使用本地路径从此存储库中指定配置文件: ./logstash -f /ls-gdelt-pipeline.conf 如果您遇到问题并希望完全“重置” LogStash,则需要手动删除其“自”数据库...例如在Linux中: rm ~/.sincedb* 如果事情似乎无法正确处理

立即下载
zip文件
Gdelt:Gdelt工具

格德尔特 Gdelt工具

立即下载
zip文件
gdelt-conflict:GDELT冲突数据集1.0

GDELT冲突数据集1.0(2021) 免责声明 我将此数据集构建为个人项目。 它没有任何保证。 随意将其用于您自己的项目或文章,但请承认我。 并记住要引用GDELT项目及其 我将来可能会发布新版本,但不能保证。 如果您分析数据,请告诉我。 我很想看看你发现了什么。 介绍 该存储库记录了2021年GDELT冲突数据集的来源。 可对世界各地的新闻媒体进行持续监控。 它的档案可以追溯到1979年1月1日。该数据库据说每15分钟更新一次。 他们的任务是“建立世界所有国家的人类社会规模的行为和信仰目录”。 GDELT冲突数据集利用GDELT来检查过去40年中冲突的演变。 它汇总了1979年至2021年期间从258个国家的媒体报道中提取的超过8,300万个事件的信息。 这些事件分为32个类别,描述了各种规模的冲突行为,例如“没收财产,进行自杀炸弹袭击”,“占领领土”。 希望该数据集可以

立即下载
zip文件
GDELT-Graphql-Analysis:使用GraphQL分析GDELT数据

GDELT-Graphql分析 在这个项目中,我们正在使用GraphQL分析GDELT数据。 GDELT是一个免费的,不断更新的数据源,它每15分钟发布一次世界事件数据。 该项目是通过以下方式完成的: 里卡多[ ] Maxim [ ] 卡尔·古斯塔夫[ ] 该项目是塔尔图大学大数据管理课程的一部分。 您可以在了解更多信息 所需软件 码头工人Python 3.5 Node.js 从头开始在本地运行项目 此块中的所有命令应依次在各自的“终端”窗口中依次运行。 启动Kafka集群和数据库 bash kafka_cluster.sh 启动卡夫卡制片人 bash producer.sh 启动卡夫卡消费者 bash consumer.sh 启动生产服务器 bash server.sh 运行开发服务器(在server.sh之后) nodemon src / server .

立即下载
pdf文件
2018_Predicting Social Unrest Using GDELT.pdf

摘要:社会动荡是某些事件和社会因素造成社会普遍不满的负面后果。 我们想利用机器学习(随机森林、助推和神经网络)的力量来解释和预测何时会发生巨大的社会动荡事件(巨大的社会动荡事件是维基百科页面“美国内乱事件清单”所承认的重大社会动荡事件)。 我们审查并发现,在一次此类事件----桑德拉·布兰德的死亡----以及随后发生重大内乱的其他类似事件之后,以负面情绪发表的新闻文章数量有所增加。 我们使用从谷歌的GDELT(全球事件、语言和音调数据库)表中获取的新闻文章作为一种媒介,研究导致美利坚合众国州和县两级大规模动乱的社会因素和事件。 为了能够识别和预测县一级的社会动荡,可以部署方案/应用程序来抵消其不利影响。 本文试图解决这一任务,即识别、理解和预测何时可能发生社会动荡。  关键词:社会动荡·新闻媒体·GDELT·主题·事件·随机森林·阿达促进随机森林·LSTM

立即下载
zip文件
GDELT_Intro:有关GDELT入门的快速教程

GDELT入门 一些有关使用“事件,位置和音调的全局数据”的快速教程。 在NBViewer中查看 2015年更新 ,您无需下载任何内容即可立即分析数据集。 检查一些资源: 。 。 。

立即下载
docx文件
gdeltevent数据字段说明V2.docx

gdelt

立即下载
zip文件
gdeltPyR:基于Python的框架检索事件,语言和音调的全球数据库(GDELT)版本1.0和版本2.0数据

Linux and Mac OS Windows OS Module Version Coverage Downloads gdeltPyR gdeltPyR是一个基于Python的框架,用于访问和分析Python Pandas或R数据数据。 用户可以输入单个日期,日期范围(两个字符串的列表)或单个日期(列表中的两个以上),并返回。 Python 2即将退休。 因为gdeltPyR依赖于将终止对Python 2支持的几个库,所以谨慎地做同样的事情。 在接下来的几个月中,Python 2中的gdeltPyR功能将变得有问题。 移至Python 3以获得最佳体验。 gdeltPyR通过检索 ,并将提供一种的方法。 因此,您拥有的内核越多,提取更多数据所需的时间就越少。 此外,您拥有更多的RAM,您可以拉取更多的数据。 最后,对于RAM受限的工作流,创建一个用于提取数据,写入磁盘和

立即下载
zip文件
新闻快讯:R中使用Internet存档和GDELT Television Explorer的工具

新闻快讯:R中使用Internet存档和GDELT Television Explorer的工具

立即下载
zip文件
geo-news:使用GDELT API收集并使用Leaflet.js显示的与关键字相关的最新新闻的热图

地理新闻 一个使用GDELT API在地图上直观显示当前新闻趋势的项目(使用leaflet.js)。

立即下载
zip文件
public_datasets

public_datasets

立即下载
rar文件
数据库的使用

使用ADO数据库进行数据的读取、存储、删除、插入操作。

立即下载
doc文件
数据库使用

要使用数据库首先要创建数据库用户啦,如果不想要它当然就删除啦,所以看看这个教程吧

立即下载
zip文件
OCTCMG:一类文字收藏

重庆奥组委 MarcosGôlo的一类课文集 资讯资讯 这些一类文本集合由GDELT项目(全球事件,语言和音调数据库)的新闻标题组成。 根据IPTC(国际新闻电信理事会)的分类标准,选择了与每个文本集有关的主题。 该项目GDELT可以在这里找到和所有IPTC主题 。 通过检查新闻标题中是否包含该主题来收集新闻。 返回少于4000个新闻项的主题不被视为文本集合。 为所有文本集定义了6000个新闻项的限制。 最终,获得了183个文本集。 如何使用 !pip安装git + 从OneClassTextCollectionsLibrary导入数据集中 datasets_dictionary = datasets.load() 每个文本集合的数据框== datasets_dictionary [基本名称] 新闻ID 新闻日期 新闻标题 每个文字集的主题 -餐厅-歌剧-员工-物流-进口-洪水-关

立即下载
pdf文件
GDELT-Event_Codebook

GDELT-Event_Codebook 介绍gdelt 事件 GDELT-Event_Codebook V2

立即下载
zip文件
gdeltDataAcquisition:一个简单的Python脚本,用于过滤和获取来自GDELT项目事件数据库的数据

GDELT数据采集 一个简单的Python脚本即可从(该数据集是理解全球人类社会的最大的开放数据集)中获取数据的,它用152种语言提供了跨越200年的总计8.1万亿个数据点。 事件数据库包含超过25亿条记录,这些记录按数据组织成一组由制表符分隔的文件。 到2013年3月31日,记录将在活动发生之日以月度和年度文件存储。 从2013年4月1日开始,每天都会创建文件,并按照事件在世界新闻媒体中发现的日期(而不是事件发生的日期)存储记录。 我们的重点是该数据库的1.0版,该数据库每天都会在更新为一个新条目。 描述 该脚本从GDELT项目事件数据库v1.0原始数据中提取事件的数据集,并使用CAMEO分类法按所需事件类型进行过滤,并使用FIPS 10-4国家/地区代码对所需采取行动的国家/地区进行过滤。 给定的输出是一个逗号分隔的值文件,其中包含给定事件和国家集的已标识事件。 依存关系 该脚本在

立即下载
热门资源标签
Global site tag (gtag.js) - Google Analytics