`
ouspec
  • 浏览: 873179 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

ruby GB2312和UTF-8编码转换

阅读更多
最近在做RSS导入功能,用了rubyforge上的feedtool,还不错。

就是代码转换老是报错:Iconv::IllegalSequence

后来发现原因是网络编码很混乱,一定要加上IGNORE参数,就好了。记录一下。

Iconv.iconv("UTF-8//IGNORE","GB2312//IGNORE",text)
分享到:
评论
3 楼 sevk 2011-01-30  
把utf8编码的中文字符串最后一个字切成乱码
可以这样解决:

如果 s[-3,1].between?("\xe0","\xef")
则 切向前一个字节
2 楼 zy13 2007-07-23  

用rss的方式只能导入最近的一些文章
那么如何通过博客的html地址导入博客全部文章呢?
1 楼 jefferson 2007-01-11  
ruby编码有点不爽,我以前玩过一小段ruby的小例子,遇到utf8编码的问题,由于没有使用unicode,truncate方法在切割字符串时,有可能会把utf8编码的中文字符串最后一个字切成乱码
后来我在网上找到一些解决办法:在 environment.rb 裡面加上
$KCODE = 'u'
require_dependency 'jcode'
好像就可以支持utf8了

相关推荐

    Ruby 与编码

    Ruby 与编码 常见问题 * 乱码的问题 * Ruby 中 Unable to convert "\x89" from ASCII-8BIT to UTF8 *Incompatible character encodings: ASCII- 8BIT and UTF-8

    json:Ruby的JSON实现

    Ruby的JSON实现 描述 这是根据RFC 7159 的JSON规范的实现。 从版本1.0.0开始,将提供两个变体: ... 要对未经UTF-8编码的原始二进制字符串进行编码,请使用String的to_json_raw_object方法(该方法生成一个

    记事本的最佳替代者Notepad2最新版(绝对精典)

    --支持 ANSI、Unicode、UTF-8 等编码互换 --直接查看 NFO 文件 --可以格式化 C/C++/Java 源代码 --可以把语法高亮方案导出为 HTML、UBB 代码 --内置 BAT/C/C++/NSIS 等语法支持 --内置 NSIS 脚本编译功能(支持...

    Notepad2-mod 4.2.25.954 中文绿色版

    Notepad2-mod 4.2.25.954 - 轻量级文本编辑器、代替记事本的最佳选择 ...支持多种编码,包括 Unicode、UTF-8、Unix、Mac 文本 支持添加书签 自动完成 增强的NFO字符画文件 标记打开的文件中所有相同的文本

    tiny_tds:TinyTDS-使用DB-Library的Ruby的简单,快速FreeTDS绑定

    迄今为止,它是唯一一个在连接到SQL Server时允许客户端编码选项(默认为UTF-8)的Ruby客户端库。 它还可以正确编码所有字符串和二进制数据。 TinyTDS的动机是成为用于ActiveRecordSQL Server适配器的事实上的低级...

    MadEdit编辑器

    包括Unicode(UTF-8、UTF-16/32)、Big5、GBK以及S-JIS 支持Unicode CJK 扩展B区(Ext-B) 可进行中文繁、简体的转换 若用户输入的字符不为当前编码支持,该字符会被转换成诸如U+XXXX的Unicode格式可用正则表达式进行...

    smstools:一组Ruby和JavaScript类,以帮助进行SMS消息处理

    将UTF-8字符串转换为GSM 7位编码,反之亦然。 检测是否可以用GSM 7位编码安全地表示UTF-8字符串。 以GSM 7位编码检测双字节字符。 甚至更多。 注意GSM编码 本文中对“ GSM”编码或“ GSM 7位字母”的所有引用...

    gigo:垃圾进垃圾出。 不惜一切代价修复 ruby​​ 编码的字符串

    否则, GIGO将尽最大努力转换并强制您使用默认的内部(或 UTF-8)编码。 GIGO . load "€20 – “Woohoo”" 假设您在 ActiveRecord 模型上有一个comments列,不能保证按照您的默认外部编码返回。 然而,看看 g

    NotePad2 MOD-v1.1.1.2 (简/繁/英)

    --支持 ANSI、Unicode、UTF-8 等编码互换 --直接查看 NFO 文件 --可以格式化 C/C++/Java 源代码 --可以把语法高亮方案导出为 HTML、UBB 代码 --内置 BAT/C/C++/NSIS 等语法支持 --内置 NSIS 脚本编译功能(支持 ...

    magic_encoding:轻松管理 ruby​​ 1.9 应用程序编码的魔术注释

    魔术编码 Magic Encoding 是一个小工具,可以让您快速添加或修改表示整个... # -*- encoding : utf-8 -*- 注意事项: 现有的魔法注释被替换 文件的其余部分保持不变 您可以将选项传递给该工具以指定所需的编码和您希

    tachypomp:Tachypomp和其他故事

    源文件已以UTF-8格式重新保存,以删除无效的多字节字符(UTF-8),因为来自Gutenberg项目的源文件带有Latin-1编码。 该项目仍在进行中。 长期目标是开发一种通用框架,用于以各种格式构建内容。安装将项目克隆到...

    Windows 记事本替代工具 Notepad3 5.21.227.1 + x64.zip

    此外,Notepad3 具有以下功能:代码折叠,括号匹配,自动缩进,字自动完成,转换各种格式(ASCII,UTF-8和UTF-16)之间的字符编码,换行格式转换(在 DOS 之间(CR/LF),Unix(LF)和 Macintosh(CR)格式),多个...

    iconv:iconv 包装器

    图标 iconv 包装器,曾经是 ext/iconv 抽象的 Iconv 是 UNIX 95 iconv()函数系列的包装类,用于在各种编码... conv ( 'iso-8859-15' , 'utf-8' , text ) 实例化一个新的Iconv并使用方法Iconv#iconv 。 cd = Iconv .

    strings:一组有用的函数来转换字符串

    支持多字节字符编码,例如UTF-8,EUC-JP 处理单词之间没有空格的语言(例如中文和日语) 支持ANSI转义码 本质上灵活,可分为多个 内容 2.3倍 2.4垫 2.5消毒 2.6截断 2.7包裹 3.扩展String类 4.组成 1.用法 字符...

    java开源包1

    开发它是用于在UTF-8 Oracle实例中使用ASCII编码的Oracle 数据库中来正确的传输非ASCII字符。 Java模板语言 Beetl Beetl,是Bee Template Language的缩写,它绝不是简单的另外一种模板引擎,而是新一代的模板引擎,...

    java开源包10

    开发它是用于在UTF-8 Oracle实例中使用ASCII编码的Oracle 数据库中来正确的传输非ASCII字符。 Java模板语言 Beetl Beetl,是Bee Template Language的缩写,它绝不是简单的另外一种模板引擎,而是新一代的模板引擎,...

    java开源包8

    开发它是用于在UTF-8 Oracle实例中使用ASCII编码的Oracle 数据库中来正确的传输非ASCII字符。 Java模板语言 Beetl Beetl,是Bee Template Language的缩写,它绝不是简单的另外一种模板引擎,而是新一代的模板引擎,...

    java开源包11

    开发它是用于在UTF-8 Oracle实例中使用ASCII编码的Oracle 数据库中来正确的传输非ASCII字符。 Java模板语言 Beetl Beetl,是Bee Template Language的缩写,它绝不是简单的另外一种模板引擎,而是新一代的模板引擎,...

    java开源包2

    开发它是用于在UTF-8 Oracle实例中使用ASCII编码的Oracle 数据库中来正确的传输非ASCII字符。 Java模板语言 Beetl Beetl,是Bee Template Language的缩写,它绝不是简单的另外一种模板引擎,而是新一代的模板引擎,...

    java开源包3

    开发它是用于在UTF-8 Oracle实例中使用ASCII编码的Oracle 数据库中来正确的传输非ASCII字符。 Java模板语言 Beetl Beetl,是Bee Template Language的缩写,它绝不是简单的另外一种模板引擎,而是新一代的模板引擎,...

Global site tag (gtag.js) - Google Analytics