先说这名字好长,我也觉得长,只是没办法,本体的名字就有13字之多!上简称吧:嫦三月车征名辅,再简之:嫦车辅...唔...如何?
说正经的,写这个小程序的起因在于自己提交作品时,不知道是否已经有重复的作品,也没地方去检索。而这次活动的官网
腾讯网和
新华网都只提供登录和一览,只能一页一页翻。特别初期每天都上万的新数据,哪里翻得过来,于是自己想搞个检索和统计的辅助程序。这样有一搭没一搭的搞到现在...马上都快到截至日了...我这效率...
最终完成的辅助程序放在GAE上 ——
嫦三月车辅。因为是appspot,请自备云梯。
截至20日的部分统计信息:
其实这篇博文原打算叫“奋斗记”的,实在是有够折腾的。
- GAE数据存储的配额太低了!Datastore Write Operations 0.05 Million Ops,5万次写。我当时收集到的原始数据就13万,根本就不敢想。整理后的数据倒是只有3万,一试之下,毫无悬念的崩!减半,分两次如何?崩!好吧好吧,减到1万,再来过,崩!不高兴再试了!再少也没什么意义。
- 打算转Google Cloud SQL。必须缴费,作罢。
- 转其他Online DB。急切间没有合适的,最终作罢。
于是放弃存储,一切都On The Fly,全部走内存!话说GAE这点不错,内存倒是足够,不崩!且快!哈。除了每次启动后重新上传数据...
再就是数据,真够劲!
★
腾讯网 最初从列表页面取,可以一次多条,效率会高,毕竟有十几万(至10月17日)的数据,但是此路不通。一是没有作者,日期等信息,二是名字过长时用...代替。最终改成从详细页面取,十几万的数据,又不敢开多线程(不能去添乱啊),每次都得6,7个小时...
★
新华网 好些,因为本身就用论坛做的活动页面。加上数据量不大,几万(至10月17日)的数据,每页20楼,半个小时就搞定。但是,新华网的问题是把作者提交的作品和描述等都合并在一处显示,用<br>分割。还自动为每个名称加上“号”字,这处理就比较多余了。因为作者本身就会以“Xx号”命名,于是满眼的”Xxx号号”,我整个人都“号号”了。
★
最后是作品 真够劲!正常是每人限5件作品,名称和描述分开。无论腾讯还是新华都是有输入框的,名称有名称的输入框,描述有描述的输入框。应该说绝大多数作品都是按规矩来的,但还有那许多的作者“勇于打破条条框框”!
- 名称和描述都写在名称里的。
- 多个名称用标点符号或文字分割写在一次提交里的。这是我处理分隔符的正则表达式。
半角空白|全角空白|,|,|》|《|】|【|、|;|/|/|;|:|:|。|(|)|\"|”|“||\\(|\\)|\\*|&|’|‘|[|]|\\d{1}\\.|简称|或(者){0,1}(叫){0,1}
- 上面这些分割符的用途也各不相同,有的是分割多个名字的,有的是标注读音的,有的则是名称描述的...我选择数据量最大的“分割”来处理。
- 然后是后缀。由于设计上打算去除重复的数据,比如“玉兔”和“玉兔号”或“玉兔号月球车”,这些都算做“玉兔”。但是这些个后缀也太“丰富”了。这是我能分辨后缀的正则表达式。
(((?i)no)*(—|-|·|\\.)*(\\d|一|二|三|I|壹|X|1)*(号|號)*(月球|探月|探测)*(车|器)*)*$
(这么看来恐怕官网得上大量人工处理了吧...)
由于能力有限,太多例外,只能做最简处理。毕竟只是辅助程序,所以一定有好多漏洞。比如哪位的作品叫:“简称”,那么多半会被我的程序滤掉了。
- 大小: 38 KB
分享到:
相关推荐
玉兔叫月球车3d打印模型免费下载_嫦娥三号月球登陆器slt文件3d模型3d打印技术网(3ddyjsw.com)免费下载
2013 年12 月全程参加了嫦娥三号着陆器和月球车X 频段的VLBI 测定轨测定位任务. 在嫦娥三号中, 利用天马望远镜代替上海佘山25 m 射电望远镜, 使中国VLBI 观测网的灵敏度提高至1.67 倍. 同时, 利用2 比特采样代替...
1.此处主要探究的是嫦娥三号探测器在月球表面的软着陆问题。2.分析着陆轨道的特点,设计着陆轨道与各阶段的控制策略,对我国太空探测计划具有重要意义。3.此处主要采用微分动力学方程、最优控制策略等方法对问题进行...
具体描述出嫦娥三号卫星的着陆过程,进行数学建模比赛,提供相关信息
本文研究的是嫦娥三号探测器在月球表面的软着陆问题。分析着陆轨道的特点, 设计探测器的着陆轨道与各阶段的控制策略,对我国太空探测计划具有重要意义。本文主要采用微分动力学方程、最优控制策略等方法对问题进行...
嫦娥三号_月球探测器的轨道确定和月面定
通过最优化方法确定CE-3最佳软着陆轨迹
在介绍了嫦娥三号地面验证需求及地面验证试验的要求之后, 重点介绍 了系统级的专项试验策划、实施情况, 以及试验的结果, 最后对嫦娥三号地面试验方法与试验技术进行了总结, 对未来深空探测器研制试验具有重要的参考...
嫦娥三号软着陆轨道设计与控制策略_,嫦娥三号软着陆轨道设计与控制策略数学建模优秀论文,matlab源码.zip
此matlab程序为嫦娥三号在主减速阶段与粗避障阶段的最优控制程序
[2014年国赛MATLAB创新奖A题]浙江工业大学-嫦娥三号软着陆轨道设计与控制策略.rar数学建模
数学建模嫦娥三号软着陆轨道设计与控制策略算法实现
2014年全国大学生数学建模竞赛的A题。嫦娥三号软着陆轨道设计的优秀示范论文
嫦娥三号自主避障软着陆控制技术,详尽相关的物理与数学知识。
2014年A题嫦娥三号软着陆轨道设计与控制策略, 国赛2014A
为实现嫦娥三号月球车全景相机图像的无缝镶嵌,针对全景相机序列图像光照不均、月表影像的特殊性等问题,提出了一种基于加速稳健特征(SURF)算法的嫦娥三号全景相机图像全景镶嵌方法。采用SURF算法提取特征点,用SURF...
数学建模国赛优秀论文集锦-2014年国赛一等奖A嫦娥三号软着陆轨道设计与控制策略-华南农业大学-论文