横瓜执导众程序员开展大讨论关于C、JAVA及其它主流IT技术使用情况和优点缺点。 -

woganwuping

浏览: 76417 次

最近访客更多访客>>

Fly872365

narlian

htf120

hwzyyx

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

2013-07 ( 5)
2013-06 ( 114)
2013-05 ( 108)
更多存档...

横瓜执导众程序员开展大讨论关于C、JAVA及其它主流IT技术使用情况和优点缺点。

横瓜执导众程序员开展大讨论关于C、JAVA及其它主流IT技术使用情况和优点缺点。

遥执乾坤(44758121)18:21:23
mysql据说只能使用一个索引，我这里几乎所有字段都有索引。
但每个字段就算用索引，也需要扫描至少100w以上记录。
横瓜(601069289)18:23:12
mysql支持16个索引
对1-3字段索引属于优质的数据库结构
横瓜(601069289)18:24:56
再多了,就是数据库结构设计不合理
横瓜(601069289) 17:53:15

处理大数据，对于计算要放应用层
不要采用SQL执行计算,可以垂直分解应用业务和复杂计算
横瓜(601069289) 17:54:50
如果数据量特别大,请采用水平方式来分解应用业务和复杂计算
采用水平方式来分解应用业务和复杂计算，可处理TB级的数据量,为全世界提供信息服务
横瓜(601069289) 17:59:20
采用普通PC+固态硬盘+水平分解业务+缓存+LINUX2.4以上的版本+接入层请求分发均衡
~游濄丿群鴨(39012090) 2013-6-28 10:49:07
java 是有些东西做不了
上海-石头哥(59851444) 2013-6-28 10:49:21
靠！
当然了
人也有些东西做不了
这些都是正常的
做驱动程序就不适合用java
Glory(1302516908) 2013-6-28 10:50:30
唉，不说了，都是血泪，这么多年，绕不开java的队伍，都是血泪，和java队伍搭班子太累
上海-石头哥(59851444) 2013-6-28 10:50:43
你没遇到对的人
不是java的问题
最难相处也是人
~游濄丿群鴨(39012090) 2013-6-28 10:51:03
比如让c c++来做web的前端开发，会不会比较麻烦？
上海-石头哥(59851444) 2013-6-28 10:51:12
会
北京-普通人(409031406) 2013-6-28 10:51:26
谁会用c++，c做前端
~游濄丿群鴨(39012090) 2013-6-28 10:51:44
是的咯
北京-普通人(409031406) 2013-6-28 10:53:23
c++、c配合JAVA或者PHP啥的，都挺好的嘛，c服务端数据处理
Glory(1302516908) 2013-6-28 10:53:27
有做java的吗？
请教个问题
遥执乾坤(44758121) 2013-6-28 10:53:56
java至少用过5-6年的才能做事情。用3年以下的人，很喜欢弄一堆构架进去，啥spring, hibernate, structs。。。做企业级应用，这些都是垃圾东西。
Glory(1302516908) 2013-6-28 10:54:08
一个小狗屁项目，hibernate配置数据库，就比直接写数据库访问快？
遥执乾坤(44758121) 2013-6-28 10:54:56
大公司也不用这些东西，因为前后分离，ao dao分离，无法用他们。
然后剩下的就只有没有经验的人，天天被那帮所谓的学校老师忽悠，以为这些很牛叉。
Glory(1302516908) 2013-6-28 10:55:29
乾坤说的太对了
北京-普通人(409031406) 2013-6-28 10:56:03
不比直接写数据库快。
~游濄丿群鴨(39012090) 2013-6-28 10:56:09
hibernate 比较适合通用
空/卡皮(501968942) 2013-6-28 10:56:11
大家在批判学校的？
Glory(1302516908) 2013-6-28 10:56:14
弄一堆东西进去，来个新功能，发现无法套那堆东西，然后告诉你：java实现不了，java就这么被恶心了
~游濄丿群鴨(39012090) 2013-6-28 10:56:28
有些公司就喜欢一劳永逸。搞个hibernate就可以通用任何数据库
不用你在重新重写sql
遥执乾坤(44758121) 2013-6-28 10:57:35
问题是，正规的公司几乎都是mysql。。。 oracle那么贵，一般人根本用不起。
~游濄丿群鴨(39012090) 2013-6-28 10:58:10
就像你说的企业开发，就特别喜欢用hibernate
比如 DB2 INFORMIX
等乱起八糟的数据库都会碰到
Glory(1302516908) 2013-6-28 10:58:36
企业应用，那也可以理解了
我他妈做个自家的系统，硬件都是自己配的，别说软件了，程序员也非得弄进这一套来，这不是找骂？
~游濄丿群鴨(39012090) 2013-6-28 10:59:35
不过hibernate可以和直接写sql 混用
遥执乾坤(44758121) 2013-6-28 10:59:40
调用别人的数据库是最痛苦的事情。。。
~游濄丿群鴨(39012090) 2013-6-28 11:00:44
我估计是那个程序员用惯了hibernate，因为它也帮助程序员少些代码。
~游濄丿群鴨(39012090) 2013-6-28 11:00:53
甚至不用写sql
Glory(1302516908) 2013-6-28 11:02:02
这就出来问题了——部分java程序员招骂第一原因：套路化
广州-恒-java(821600682) 2013-6-28 11:02:14
公司开发一套通用的，现场部署时数据库可能是别人的，表名，字段名可能不一样，ORM这个个人感觉还是有需要的。。
上海-石头哥(59851444) 2013-6-28 11:02:36
你们一味的骂是因为不适合你们
Glory(1302516908) 2013-6-28 11:02:45
就像彪哥打架，一套热身还没打完，人家一脚踢到裤裆，你已经趴下了
上海-石头哥(59851444) 2013-6-28 11:02:51
结合自己的观点
遥执乾坤(44758121) 2013-6-28 11:03:17
框架的确不适合啥东西都是自己的。
~游濄丿群鴨(39012090) 2013-6-28 11:03:23
框架有适用范围，具体用不用。还不是老大说得算
遥执乾坤(44758121) 2013-6-28 11:03:37
但如果数据库都是别人的，那就最好用个来屏蔽差异了。
北京-普通人(409031406) 2013-6-28 11:03:38
如果觉得hibernate不好用，可以直接开发ORM，很多公司也会自己封装自己的orm。其实hibernate优势还是慢多的
满多的
上海-石头哥(59851444) 2013-6-28 11:03:44
hibernate在快速开发上还是有很强大的，也很自动，不过要完全用得游刃有余，那绝对是高手所为，我其实不建议新生用
Glory(1302516908) 2013-6-28 11:03:54
再一个就是霸王硬上弓，前一阵碰上一个学生，给我们做推荐算法，上亿的数据，非得java，结果32G的内存怎么都搞不定
北京-普通人(409031406) 2013-6-28 11:04:03
想用好hibernate还是要高手
上海-石头哥(59851444) 2013-6-28 11:04:18
如果一直使用hibernate，但本身自己sql基础不牢，其实到后期很致命
遥执乾坤(44758121) 2013-6-28 11:04:20
对。hibernate我当年用的时候，被里面的几个bug搞死了，后来只能修改hibernate源码才搞定。浪费了太多时间。
~游濄丿群鴨(39012090) 2013-6-28 11:04:47
hibernate只能完成80%的任务。
abc(951514291) 2013-6-28 11:04:57
要不就用Mybatics，JPA
~游濄丿群鴨(39012090) 2013-6-28 11:05:08
一些复杂查询，还是得sql来的直接
Glory(1302516908) 2013-6-28 11:05:19
后来直接把他踢走，换另外一个学生过来，8G内存稳定可控，一天推荐的算量还提高好几倍
遥执乾坤(44758121) 2013-6-28 11:06:05
我写了一个2个文件，一个db操作，一个多链接cache，然后就解决了80%的数据库问题。操作方式和hibernate的基础方式几乎一样。也是没有sql语句就能办事情。
北京-普通人(409031406) 2013-6-28 11:06:06
很多做JAVA的人，做内存控制，内存处理这块，是没有概念的
Glory(1302516908) 2013-6-28 11:06:28
只是内存控制没概念还好，关键是数据结构没概念
上海-石头哥(59851444) 2013-6-28 11:06:40
如果sql本身基础很牛B，那你用hibernate我觉得还是可以大大开发效率
~游濄丿群鴨(39012090) 2013-6-28 11:06:53
hibernate 有个很大的用处就是通用各种数据库呀
Glory(1302516908) 2013-6-28 11:07:13
上亿的数据，本是稀疏矩阵，他竟然敢使用两级字典做数据结构
上海-石头哥(59851444) 2013-6-28 11:07:18
后来我一直用ibatis
遥执乾坤(44758121) 2013-6-28 11:07:23
通用数据库，是我认为hibernate唯一值得用的地方。
上海-石头哥(59851444) 2013-6-28 11:07:36
是因为我也不太喜欢太多的限制
~游濄丿群鴨(39012090) 2013-6-28 11:07:45
不然仅仅是db操作和cache，很多db库都能做
上海-石头哥(59851444) 2013-6-28 11:07:51
这点似乎没啥用
谁会老换数据库
遥执乾坤(44758121) 2013-6-28 11:08:10
适合你调用别人数据库的情况。
别人的数据库天知道啥玩意。有些还是嵌入式的呢。
~游濄丿群鴨(39012090) 2013-6-28 11:08:25
恩
上海-石头哥(59851444) 2013-6-28 11:08:51
我游走过几个公司，有银行，也有第三方支付等
发现hibernate在这些地方出场并不高
几乎没有
都是用ibatis
Glory(1302516908) 2013-6-28 11:09:44
访问量略微大一点，hibernate撑不住啊
上海-石头哥(59851444) 2013-6-28 11:10:19
关键不是这个
是生成的sql不一定可控，这也是很大一方面
~游濄丿群鴨(39012090) 2013-6-28 11:11:21
访问量大的地方得另外处理了。hibernate 不适合做互联网应用，做做后台管理还是可以的。
上海-石头哥(59851444) 2013-6-28 11:11:23
自己写sql嘛，你懂的，出来的什么都知道
遥执乾坤(44758121) 2013-6-28 11:11:25
我写的代码和ibatis的结构很像，呵呵。就是轻量很多。
但同时也有bug的多。。。唉。
abc(951514291) 2013-6-28 11:12:00
访问量大，并发高，把hibernate的缓存用好，再结合第三方缓存框架也可以啊
上海-石头哥(59851444) 2013-6-28 11:12:03
bug多慢惭改
慢慢改
~游濄丿群鴨(39012090) 2013-6-28 11:12:54
后台统计、计算这些未必还用hibernate啊？
遥执乾坤(44758121) 2013-6-28 11:13:29
就一个接口。剩下的就是Mysql，oracle的实现了。
jace(793727599) 2013-6-28 11:14:48
你们有专职做数据分析工作的吗？
Glory(1302516908) 2013-6-28 11:14:52
有那个空改第三方框架的bug，就不能自己写？
最有意思的，java比c++队伍多一个岗位：系统架构师
遥执乾坤(44758121) 2013-6-28 11:15:46
c++也有。。。
Glory(1302516908) 2013-6-28 11:15:54
~游濄丿群鴨(39012090) 2013-6-28 11:15:59
架构师应该都有吧。
上海-石头哥(59851444) 2013-6-28 11:16:07
呵呵！
遥执乾坤(44758121) 2013-6-28 11:16:10
搜索构架师。
Glory(1302516908) 2013-6-28 11:16:14
事实上是有，但c++的队伍较少公开专门招
jace(793727599) 2013-6-28 11:16:14
类似数据科学家的角色
上海-石头哥(59851444) 2013-6-28 11:16:20
系统架构师并不是指语言的
java的也有好吧
你们把语言看得太重了
我想说太年轻
了
Glory(1302516908) 2013-6-28 11:17:00
说的太对了，真正的系统架构师应该是通用的
遥执乾坤(44758121) 2013-6-28 11:17:04
构架师只有大规模项目才需要。
上海-石头哥(59851444) 2013-6-28 11:17:07
我们公司的就是
Glory(1302516908) 2013-6-28 11:17:14
但java通常有个专门岗位：jva系统架构师，
上海-石头哥(59851444) 2013-6-28 11:17:18
虽然不见得比我牛B
呵呵！
那是错误的认识
Glory(1302516908) 2013-6-28 11:18:00
很多公司专门招java系统架构师的
上海-石头哥(59851444) 2013-6-28 11:18:02
我们公司的架构师常常问我一些问题的
Glory(1302516908) 2013-6-28 11:18:24
条件就是熟悉各类java框架
加速度(272551280) 2013-6-28 11:18:24
solr 查询返回时剔除了html的内容怎么改成不剔除呢？
上海-石头哥(59851444) 2013-6-28 11:18:26
强调的是系统及架构
加速度(272551280) 2013-6-28 11:19:16
solr 查询返回时剔除了html的内容怎么改成不剔除呢？
有哪位同学研究过这个？
Glory(1302516908) 2013-6-28 11:20:23
我们土比，偶尔用用solr，都是自己转码
~游濄丿群鴨(39012090) 2013-6-28 11:20:44
呵呵熟悉主流框架，就能从这些成熟的产品吸取经验嘛
遥执乾坤(44758121) 2013-6-28 11:31:04
有运维人员想找工作不？
哥不要开发，开发找个在校大学生就能搞定了。需要的是运维，因为运维没有几年经验，啥都不会。
~游濄丿群鴨(39012090) 2013-6-28 11:32:27
开发这么不值钱了。。。
遥执乾坤(44758121) 2013-6-28 11:33:13
，核心开发有人了啊，外围开发自然找几个实习生足够了。
北京-***(506650296) 2013-6-28 11:34:15
恩，学生可塑性高，听话
jace(793727599) 2013-6-28 11:56:19
只要有钱有人有咨询，想不嬴都不行
jace(793727599) 2013-6-28 12:02:03
有钱意味能用最稳定最先进的架构，有人意味着分工明确，每个领域都各司其职，有专业的工程师，有咨询意味着可以跟IBM、Oracle、teradata、intel等合作，搞一些规范成熟的方案。
jace(793727599) 2013-6-28 12:03:03
类似于拍电影，有导演有剧本有主角。
jace(793727599) 2013-6-28 12:09:01
所以窝在大公司里可以学到很多东西
Glory(1302516908) 2013-6-28 12:10:51
头一次听说，窝在大公司里可以学到很多东西
jace(793727599) 2013-6-28 12:11:40
反正我学到挺多的
Glory(1302516908) 2013-6-28 12:13:11
上边的人可以学到很多东西
而且有足够的钱来回折腾
十一月的肖邦(1041901964) 2013-6-28 12:13:35
大公司学得多吗
表示想去大公司
Glory(1302516908) 2013-6-28 12:14:12
像阿里的技术高层，大概把所有的高性能方案都学习探索过
空/卡皮(501968942) 2013-6-28 12:15:10
进不去啊
Glory(1302516908) 2013-6-28 12:16:23
我当年去华为，操成天就那点屌东西，整个三级部门就那点屌东西
要学东西，大概得混到三级部门经理以上的级别了
遥执乾坤(44758121) 2013-6-28 12:19:17
去互联网公司吧，的确可以学到很多东西，只要你愿意。
空/卡皮(501968942) 2013-6-28 12:23:33
哦哦
初学者进也难啊
Glory(1302516908) 2013-6-28 12:23:56
有没有阿里的？过两年现在的公司成不了，争取去阿里了
遥执乾坤(44758121) 2013-6-28 12:24:23
阿里不要大于30岁的人。
空/卡皮(501968942) 2013-6-28 12:24:37
为什么
遥执乾坤(44758121) 2013-6-28 12:24:45
没有前途了啊。
Glory(1302516908) 2013-6-28 12:24:49
扯啊，阿里动不动开年薪五六十万，都是30多岁的人
南京-听风(190661155) 2013-6-28 13:30:18
怎么可能不要30岁以上的人，阿里需要的反而大多数是30岁以上经验丰富的
十一月的肖邦(1041901964) 2013-6-28 13:36:41
action怎样获取前台select 的值
阳光(413055687) 2013-6-28 14:04:43
request.getParameter("")就可以，或者Action里变量名称跟select名字一样，有getXXX,setXXX方法也行
北京-普通人(409031406) 2013-6-28 16:51:27
有遇到这样的情况么，在window下，用jdbc去跑100个mysql查询需要600毫秒，在linux需要1500毫秒
遥执乾坤(44758121) 2013-6-28 16:54:51
mysql下，跑一个简单的select范围查询，有索引的情况下，花费了2分钟，大家又遇到过么？
上海-石头哥(59851444) 17:00:12
把sql贴出来看看吧
说不定可以看出什么端倪
100个才600ms
还有什么可以说的啊
2分钟的看一睛
遥执乾坤(44758121) 17:03:24
select AvgDownloadSpeed,UploadTaskTime,peerid,TaskDefinitionID from taskexecmain where UploadTaskTime>='2013-06-18 00:00:00 000' and UploadTaskTime<'2013-06-19 00:00:00 000' and TaskDefinitionID in ('7194','7195','7196',) and totalDownLoadTime>'1.4E-45' and totalDownLoadTime<'200.0' and (errorcode is null OR errorcode = '0') limit 0,5000, time:226613167540,ok:true
time:226613167540 纳秒，其实就是226秒。
上海-石头哥(59851444) 17:05:22
我的妈呀
7194 ~ 7489
上海-石头哥(59851444) 17:05:55
这是连起来的啊
上海-石头哥(59851444) 17:07:30
and (errorcode is null OR errorcode = '0')
把这个 is null
换成其它方式试试
去掉这个能快多少
遥执乾坤(44758121) 17:11:01
实际的in有1k多个值，这里拷贝不下。
上海-石头哥(59851444) 17:13:04
in里边的数据是string不是int的吗
还有你数据字段用是的string是吗
遥执乾坤(44758121) 17:14:24
in里面是int，但这些int不能保证连续。
京-一夏<wpx378802619@qq.com> 17:14:33
in换成exists试试
上海-石头哥(59851444) 17:14:40
那你把引号去掉
遥执乾坤(44758121) 17:14:46
不是一样么？
引号这种就算转化也会很快才对啊。
北京-普通人(409031406) 17:24:36
mysql在你本地，还是其他机器上
遥执乾坤(44758121) 17:24:50
都是本机跑的。
北京-普通人(409031406) 17:25:18
那本机跑。应该挺快递
Glory(1302516908) 17:25:24
我们现在倒腾数据都用shell，发现shell真他妈强大
mysql里只剩下最后简单查看的数据，几乎不用mysql做任何略微复杂的运算了
北京-普通人(409031406) 17:27:38
shell确实很强大
awk 对数据处理很强大
遥执乾坤(44758121) 17:28:35
awk处理文本数据，已经足够了。
南京-听风(190661155) 17:28:35
我也听说了，能举个应用场景吗
举个应用的例子
北京-普通人(409031406) 17:29:56
对文本数据处理，确实完全够了
Glory(1302516908) 17:31:15
非实时系统就有这个好处，早晨8点上班前把数据准备好就OK
北京-普通人(409031406) 17:31:41
一般用于做分析，做计算用
Glory(1302516908) 17:31:51
再大的数据都不存在大数据问题了
北京-普通人(409031406) 17:31:54
恩。大数据公司估计用的多
Glory(1302516908) 17:33:58
好像群里有些兄弟去年去云基地，云基地都做什么啊？
南京-听风(190661155) 17:34:20
哪个云基地？
云基地现在多如牛毛
北京-普通人(409031406) 17:35:34
云基地？在那里
云基地搞云计算？
Glory(1302516908) 17:36:07
北京北边什么云基地，去年群里不是好几个人去吗？
北京-醉(253215039) 17:40:59
@乾坤：
上面那个sql所在表什么量级？
遥执乾坤(44758121) 17:46:54
1100w
北京-醉(253215039) 17:49:17
应该是做全表扫瞄了
遥执乾坤(44758121) 17:50:18
没有，全部扫描估计30分钟都搞不定，有好几十个G呢。
北京-醉(253215039) 17:50:42
这么大的表啊？
北京-醉(253215039) 17:51:45
一条纪录有5k？
遥执乾坤(44758121) 17:52:15
没有5k，但也有上K。
横瓜(601069289) 17:53:15
计算要放应用层
不要采用SQL执行计算
北京-醉(253215039) 17:53:53
高版本mysql应该会自动优化
Glory(1302516908) 17:54:06
先加个where TaskDefinitionID > <的条件，大概能快很多
横瓜(601069289) 17:54:21
可以采用垂直分解应用业务和复杂计算
遥执乾坤(44758121) 17:54:41
TaskDefinitionID 有十万多个。
横瓜(601069289) 17:54:50
如果数据量特别大,请采用水平方式来分解应用业务和复杂计算
采用水平方式来分解应用业务和复杂计算
可处理TB级的数据量,为全世界提供信息服务
北京-醉(253215039) 17:55:30
如果是int型，查询时加了引号，未必能用到索引。
遥执乾坤(44758121) 17:55:45
mysql好像只能用一个索引。
北京-醉(253215039) 17:55:56
另外得把is null去掉吧，这东西肯定不命中索引
横瓜(601069289) 17:56:12
必要时,可以支持1秒/10万次-100万次的请求
北京-醉(253215039) 17:56:31
可以有多个，但你这么大的表，也不能多建。
横瓜(601069289) 17:56:46
如果优化到非常完美的情况下,可以支持1秒/10万次-100万次的请求
北京-醉(253215039) 17:56:54
这么大数据，索引也很耗资源
横瓜(601069289) 17:57:05
等于100个GOOGLE的请求水平
北京-普通人(409031406) 17:58:21
1秒/10万次到100万次的请求，应该要看cpu和数据量吧
Glory(1302516908) 17:59:11
那些值都是连续的，肯定是大小比较嘛，怎么会用in?
横瓜(601069289) 17:59:20
采用普通PC+固态硬盘+水平分解业务+缓存+LINUX2.4以上的版本+接入层请求分发均衡
北京-醉(253215039) 17:59:22
1秒10万次请求，真实的qps也就1000左右把，允许有100ms的网络延迟

分享到：