`

pymongo 中文乱码问题

 
阅读更多

原文地址:

http://windkeepblow.blog.163.com/blog/static/1914883312013988185783/

 

 如题,其实我的问题很简单,就是在写爬虫的时候拿到网页的信息包含类似“\u65b0\u6d6a\u5fae\u535a\u6ce8\u518c”的字符串,实际上这是unicode的中文编码,对应的中文为“新浪微博注册”。其实我就是想找一个函数让这一串东西显示中文而已,没想到百度了白天找到合适的。遇到这种问题千万不要用什么 “python编码” “unicode中文编码” “unicode解码”这样的关键字去搜,一大堆网页出来毫不相关。

      其实这个问题一个函数搞定,如下:

Example 1:

>>> s = r"\u65b0\u6d6a\u5fae\u535a\u6ce8\u518c"

>>> s

'\\u65b0\\u6d6a\\u5fae\\u535a\\u6ce8\\u518c'

>>> print s

\u65b0\u6d6a\u5fae\u535a\u6ce8\u518c

>>> s = s.decode("unicode_escape");     #就是这个函数

>>> print s

新浪微博注册

 

Example 2:

>>> str_ = "Russopho\xe9bic, clichd and just pl\xe9ain stupid."

>>> print str_

Russopho?bic, clichd and just pl?ain stupid.

>>> str_ = str_.decode("unicode_escape")

>>> print str_

Russophoébic, clichd and just pléain stupid.

(这个方法解决了我在插入数据到mongodb时遇到的“bson.errors.InvalidStringData: strings in documents must be valid UTF-8”问题)

 

附上关于这个问题的相关博客链接:http://www.cnblogs.com/yangze/archive/2010/11/16/1878469.html

小结:

以后遇到奇葩问题要想好关键字再搜,不然很有可能一无所获。

分享到:
评论

相关推荐

    Python访问MongoDB,并且转换成Dataframe的方法

    此外,它还处理了CSV文件的中文乱码问题,并根据需求可选择性地移除DataFrame中的默认 '_id' 字段。 总结一下,这个示例中实现的功能包括: 1. 使用pymongo库建立与MongoDB的连接。通过提供MongoDB的主机名、端口...

    Python连接mssql数据库编码问题解决方法

    由于Python对中文的支持一直存在一些问题,导致在连接包括但不限于mssql数据库时,我们经常遇到查询结果出现乱码的情况,其中最常见的便是显示为问号。这不仅影响了数据的正确显示,也极大地影响了数据处理的效率和...

    实训商业源码-付费进群自动定位版本-毕业设计.zip

    实训商业源码-付费进群自动定位版本-毕业设计.zip

    单级热电制冷器件,全球前20强生产商排名及市场份额(by QYResearch).pdf

    单级热电制冷器件,全球前20强生产商排名及市场份额(by QYResearch).pdf

    实训商业源码-Turbo Website Reviewer SEO分析报告工具源码-毕业设计.zip

    实训商业源码-Turbo Website Reviewer SEO分析报告工具源码-毕业设计.zip

    COMSOL模拟铌酸锂波导倍频PPLN技术解析及实操经验分享

    内容概要:本文详细介绍了利用COMSOL进行铌酸锂波导倍频(PPLN)仿真的方法和技术难点。首先讨论了材料设置中非线性系数d33的空间调制方式,推荐使用tanh函数代替sign函数以提高收敛性。接着阐述了波导结构的选择和模式分析的关键步骤,强调了正确设置边界条件的重要性。对于网格划分提出了在极化周期交界处局部加密的方法,并解释了分步求解策略以节省内存。最后,作者提醒注意相位匹配条件以及考虑实际器件制造中的工艺误差对转换效率的影响。 适合人群:从事非线性光学研究、光子学器件设计的研究人员和工程师。 使用场景及目标:帮助读者掌握COMSOL软件中针对PPLN结构的仿真技巧,优化仿真流程,提升仿真准确性,解决实际项目中可能遇到的问题。 阅读建议:由于文中涉及大量具体的操作细节和技术要点,建议读者结合自己的项目背景仔细研读每个部分的内容,并尝试将所学应用到实践中去。

    PLOT2222222222

    PLOT2222222222

    新能源领域的技术创新:19永磁直驱风机+混合储能+PQ逆变并网系统

    内容概要:本文介绍了“19永磁直驱风机+混合储能+PQ逆变并网”系统,这是一种集成永磁直驱风机、混合储能设备和PQ逆变器的综合性解决方案,旨在实现可再生能源的高效利用和电网的稳定并网。文中详细阐述了各组件的工作原理及其协同效应,强调了该系统在提高能量转换效率、增强电网稳定性和改善供电质量方面的优势。通过对实际应用效果的分析,展示了该系统在低风速环境下的稳定输出能力、混合储能系统的削峰填谷作用以及PQ逆变器的智能调控和保护功能。 适合人群:从事新能源研究和技术开发的专业人士,关注绿色能源发展的科研工作者和政策制定者。 使用场景及目标:适用于风电场建设、分布式能源系统规划等领域,旨在推动可再生能源的广泛应用,促进电网的智能化和稳定性。 其他说明:随着可再生能源的发展,该系统有望在全球范围内获得更广泛的应用,成为未来能源领域的重要组成部分。

    商用车P2并联混合动力系统HCU控制策略解析与建模指南

    内容概要:本文详细介绍了商用车P2并联混合动力系统的HCU(整车控制器)控制策略及其建模方法。首先探讨了模式切换策略,针对不同工况如车辆速度、电池电量等因素进行模式选择。接着深入讲解了扭矩分配策略,考虑到了温度变化以及坡道情况对扭矩分配的影响。此外,还讨论了能量回收策略,利用预测性制动提高能量利用率。最后提及了故障降级策略,确保系统在出现故障时能够快速响应。文中提供了多个具体代码片段来辅助理解和实施这些策略。 适合人群:从事汽车电子控制系统开发的技术人员,尤其是专注于混合动力系统的研究人员和工程师。 使用场景及目标:帮助开发者将理论性的功能规范转化为实际可用的控制模型,适用于商用车P2并联混合动力系统的开发过程中,旨在提升系统的效率和平顺性。 其他说明:建议读者在实践中不断调整和完善模型参数,以适应不同的应用场景和技术要求。同时,在构建模型时应注意保持良好的可追溯性和验证性,以便后续维护和改进。

    openai-agents-python-AI人工智能资源

    OpenAI Agents SDK

    干式无油螺杆空压机,2024年前13大企业占据全球78%的市场份额.pdf

    干式无油螺杆空压机,2024年前13大企业占据全球78%的市场份额.pdf

    实训商业源码-多功能水果外卖电子商务手机模板-毕业设计.zip

    实训商业源码-多功能水果外卖电子商务手机模板-毕业设计.zip

    .NET Framework 3.5(Windows server系统)

    .NET Framework 3.5(Windows server系统)

    全国大学生电子设计竞赛的预测.pdf

    电子设计竞赛相关资源

    电子设计竞赛论文要点.pdf

    电子设计竞赛相关资源

    膜用聚砜,全球前9强生产商排名及市场份额(by QYResearch).pdf

    膜用聚砜,全球前9强生产商排名及市场份额(by QYResearch).pdf

    信號完整性小技巧 #2 EYE CONTOUR.pdf

    信號完整性小技巧 #2 EYE CONTOUR.pdf

    常规S参数与共模差模S参数转换.pdf

    常规S参数与共模差模S参数转换

    实训商业源码-UNIAPP开发的软件市场多端源码-毕业设计.zip

    实训商业源码-UNIAPP开发的软件市场多端源码-毕业设计.zip

    振动与噪声分析领域中LMS系统的模态分析与锤击实验实践指南

    内容概要:本文详细介绍了LMS(LabVIEW Multifunctional System)测试系统在模态分析和锤击实验中的应用。首先解释了LMS系统及其核心功能——模态分析,这是一种用于确定结构振动特性的关键技术,可以获取固有频率、阻尼比和模态形状等参数。接着阐述了锤击实验的具体步骤,包括实验准备、数据采集、激励与响应记录、数据分析和结果解读。文中还简要介绍了LMS系统中使用的软件工具,涵盖数据导入、滤波与去噪、频域分析、模态识别与提取等功能。最后强调了模态分析和锤击实验在结构设计、优化和故障诊断中的重要作用。 适合人群:从事机械工程、振动与噪声分析的技术人员,尤其是需要掌握模态分析和锤击实验的应用工程师。 使用场景及目标:适用于希望深入了解LMS系统在模态分析和锤击实验中的具体应用,提升结构设计和故障诊断能力的专业人士。目标是在实际工作中更好地利用LMS系统进行振动与噪声分析。 其他说明:本文不仅提供了理论知识,还详细描述了实验操作流程,帮助读者更好地理解和应用相关技术。

Global site tag (gtag.js) - Google Analytics