`
riching
  • 浏览: 261372 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

分布式搜索的开源框架

 
阅读更多
1、文本搜索的内核:lucene http://lucene.apache.org/,很多的开源框架式基于lucene实现的
2、Apache Solor:http://lucene.apache.org/solr/
3、Katta:katta.sourceforge.net,基于Lucene和Hadoop的分布式搜索框架
4、Elasticsearch:http://www.elasticsearch.org/,基于Lucene的分布式搜索框架
分享到:
评论

相关推荐

    ElasticSearch Server

    本书系统讲述如何运用ElasticSearch Server搭建分布式搜索平台,如何进行分片,如何建立索引,如何索引数据,如何进行性能优化等。是一本不可多得的一本介绍分布式搜索开源框架的好书。

    大数据开源框架集锦.pdf

    ⼤数据开源框架集锦 1 ⼤数据平台 Hadoop 离线数据的分布式存储和计算基础框架 分布式存储HDFS 离线计算引擎MapReduce 资源调度Apache YARN CDH 基于稳定版Hadoop及相关项⽬最成型的发⾏版本, 成为企业部署最⼴泛的...

    分布式爬虫框架Cola.zip

    Cola是一个分布式的爬虫框架,用户只需编写几个特定的函数,而无需关注分布式运行的细节。任务会自动分配到多台机器上,整个过程对用户是透明的。pip install pyyaml安装下载或者用git clone源码,假设在目录/to/...

    基于Spring框架开源ElasticSearch搜索

    本书以实例讲述如何在Spring框架之上搭建ElasticSearch开发,以及如何利用JPA建立、更新和删除索引,如何配置ElasticSearch Server的applicationContext等。

    基于lucene和nutch的开源搜索引擎资料集合

    [硕士论文]_基于MapReduce的分布式智能搜索引擎框架研究.pdf [硕士论文]_基于Nutch的垂直搜索引擎的分析与实现.pdf 一个例子学懂搜索引擎(lucene).doc 中文搜索引擎技术揭密.doc 九大开源搜索引擎介绍.txt 基于Nutch...

    基于分布式爬虫的文章搜索引擎

    随着大数据时代的到来,信息的获取与检索尤为重要,如何在海量的数据中快速 ...在熟练运用 Python 语言的基础上,更加深入的掌握开源的爬虫框架 Scrapy,为后续其他与爬虫相关 的业务奠定理论基础和数据基础

    一个基于分布式爬虫的信安文章搜索引擎

    在熟练运用Python语言的基础上,更加深入的掌握开源的爬虫框架Scrapy,为后续其他与爬虫相关的业务奠定理论基础和数据基础;进一步理解分布式的概念,为大数据的相关研究和硬件条件奠定基础;熟练掌握Python搭建网站...

    search:搜索引擎系统&分布式系统框架

    search:搜索引擎系统&分布式系统框架

    java多商户分销系统源码-ddf:DDF分布式数据框架-一个开源、模块化的集成框架

    分布式数据框架 (DDF) 是一个开源的模块化集成框架。 特征 标准化建立在已建立的自由和开源软件 (FOSS) 和开放标准之上,可避免供应商锁定 可扩展性 可以通过开发和共享新功能来扩展功能 建立在 Apache Karaf 之上,...

    分布式协调工具-ZooKeeper实现动态负载均衡

    Zookeeper是一个分布式开源框架,提供了协调分布式应用的基本服务,它向外部应用暴露一组通用服务——分布式同步(Distributed Synchronization)、命名服务(Naming Service)、集群维护(Group Maintenance)等,...

    moviesite:分布式电影推荐系统

    这是一个结合了Hadoop,Hbase,Spark,MongoDB,Django等开源框架的高可用分布式电影推荐系统,并以Web页面为用户提供了友好的访问方式。 系统功能 基本功能 登录注册 个人信息维护 按类别电影展示 电影搜索 电影...

    JavaEE大型分布式电商项目 淘淘商城 29期

    10、 使用企业级开源系统Solr完成商品以及订单数据的搜索。 11、 在数据库存储方面使用MySQL的主从复制架构,使用Spring的AOP实现数据的读写分离,以保证在“读多写少”的场景下的高性能。 12、 使用高性能的企业级...

    vacomall:基于dubbo实现的分布式电商平台

    分布式电商平台,基于SpringMVC开发,其他相关技术,Mybatis(开源ORM框架),Mybatis-Plus(国产ORM辅助包),Dubbo(阿里巴巴开源分布式服务框架),Zookeeper(分布式协调),Redis (高效KV),ActiveMQ(消息...

    分布式深度学习库Deeplearning4j.zip

    Deeplearning4j(简称DL4J)是为Java和Scala编写的首个商业级开源分布式深度学习库。DL4J与Hadoop和Spark集成,为商业环境(而非研究工具目的)所设计。Skymind是DL4J的商业支持机构。Deeplearning4j技术先进,以即...

    java多商户分销系统源码-alliance:CodiceAlliance是一个基于分布式数据框架(DDF)的开源模块化集成框架,并增加了Do

    的开源模块化集成框架,增加了 DoD/IC 和 NATO 支持功能。 联盟特色 NITF/NSIF (STANAG 4545) 摄取和解析摄取和编目 NITF 2.1 图像并构建数据丰富的元卡以进行发现和检索 STANAG 4609 KLV 支持摄取 FMV 剪辑并提取 ...

    euler:分布式图深度学习框架

    如果有任何问题,请直接提交,也欢迎通过Euler开源技术支持邮件组( )联系我们。 执照 Euler使用许可 致谢 Euler由阿里妈妈工程平台团队与搜索广告算法团队共同探讨与开发,也获得了阿里妈妈多个团队的大力支持。...

    Maybecmsphp版v1.2

    速度快性能高 程序框架采用懒加载、分布式服务器的设计,每张表都可有自己的... 基于开源框架KONGPHP开发,安全高效。 符合SEO 符合国际W3C网站制作标准; 有利于各类搜索引擎收录、推广优化; 每个栏目及页面均有SEO优

    elk-stack-guide-cn.pdf

    ELK是Elasticsearch、Logstash、Kibana三大开源框架首字母大写简称。市面上也被成为Elastic Stack。其中Elasticsearch是一个基于Lucene、分布式、通过Restful方式进行交互的近实时搜索平台框架。像类似百度、谷歌...

    大数据技术文档.docx

    从海量的信息块中快速检索出用户真正需要的信息正变得很困难,信息搜索应向着具有分布式处理能力方向发展,本系统利用hadoop分布式开源框架良好的扩充能力、较低的运作成本、较高的效率和稳定性来满足需求。...

    基于SSM+mysql的分布式电商项目源码+数据库+项目说明(课程设计).zip

    该商城采用分布式系统架构,子系统之间都是调用服务来实现系统之间的通信,使用Dubbo框架实现。这样降低了系统之间的耦合度,提高了系统的扩展性。为了提高系统的性能使用Redis做系统缓存,并使用Redis实现Session...

Global site tag (gtag.js) - Google Analytics