`
文章列表
http://blog.csdn.net/kaede999/article/details/23336291

协同过滤

 
什么是协同过滤     协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filtering, 简称 CF),首先想一个简单的问题,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最近有什么好看的电影推荐,而我们一般更倾向于从口味比较类似的朋友那里得到推荐。这就是协同过滤的核心思想。     协同过滤一般是在海量的用户中发掘出一小部分和你品位比较类似的,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的其他东西组织成一个排序的目录作为推荐给你。当然其中有一个核心的问题: 如何确定一个用户是不是和你有相似的品位? ...
1、ICE是什么? ICE是ZEROC的开源通信协议产品,它的全称是:The Internet Communications Engine,翻译为中文是互联网通信引擎,是一个面向对象的中间件,使我们能够以最小的代价构建分布式应用程序。ICE使我们专注于应用逻辑的开发 ...
https://www.cnblogs.com/huxi2b/p/6061110.html

hbase 二级索引

http://blog.csdn.net/bluishglc/article/details/31799255
https://www.cnblogs.com/liuliliuli2017/p/6809094.html
1 Spark Streaming增大任务并发度 Q: 在Spark Streaming中,增大任务并发度的方法有哪些? A:s1 core的个数: task线程数,也就是--executor-cores       s2 repartition       s3 Streaming + Kafka,Direct方式,则增加partition分区数       s4 Streaming + Kafka,Receiver方式,则增加Receiver个数       s5 reduceByKey和reduceByKeyAndWindow传入第二个参数 1 Spark Streaming增大任务 ...
http://www.cnblogs.com/sunrye/p/6504876.html
http://www.cnblogs.com/gnivor/p/4268689.html
http://www.cnblogs.com/limingluzhu/p/5535314.html
曾在多家大公司任职的软件架构师兼顾问Kristóf Kovács在博客中对主流的NoSQL数据库(Cassandra、Mongodb、CouchDB、Redis、Riak、Membase、Neo4j以及HBase)进行了全方位的对比。 虽然SQL数据库是非常有用的工具,但经历了15年的一支独秀之 ...

zookeeper读写操作

http://blog.csdn.net/liuyuehu/article/details/52136945

zookeeper读写操作

http://blog.csdn.net/liuyuehu/article/details/52136945
异常主要内容有两点(完整异常信息参加文章结尾): ◾内存问题 thread named [main-SendThread(hadoop1:2181)] but has failed to stop it. This is very likely to create a memory leak。 ◾加载问题 java.lang.NoClassDefFoundError: org/apache/hadoop/util/ShutdownHookManager$ ...
http://www.linuxidc.com/Linux/2015-02/114230.htm http://www.wtoutiao.com/p/20fn3DY.html
Global site tag (gtag.js) - Google Analytics