span8
span4
我们公司安装了只供内部使用的FME服务器,因此我将它设置为在Office365电子邮件收件箱中轮询新邮件。imap_publisher_content列表只有一个文本/html索引,并且电子邮件正文中的文本带有编码问题。例子:与验货员见面,并对这两个2a€?电气管道线。我会把照片上传到SharePoint。
我已经附上了传入的JSON。
我有问题,试图得到正确的文字编码,不确定如何进行。
这也与我最近发表的一篇文章有关,我仍然无法修复或找到如何通过我们的在线公司Office365 exchange帐户以纯文本形式接收imap_publisher_content列表。
https://knowledge.亚搏在线safe.com/questions/82234/fme-server-polling-imap.html
你能分享一下……这两个2 a€?电气管道线。Ia€™上传…应该看起来像什么?断章取义的字符是非英语字符,对吗?
看起来这个字符串在某些地方被标记为错误的编码。到目前为止,我还不确定这是什么时候发生的,为什么会发生。
确定@LenaAt亚搏在线Safe。发送的电子邮件的原始文本应该是:与检验员会面并检查了两条2英寸的电线。我会把照片上传到SharePoint。
在所有我能找到的谷歌搜索中,似乎它将编码错误地解释为windows-1252而不是utf-8?我真的不知道,一直有问题得到正确显示。
谢谢你的帮助!搞清楚这一点有点令人沮丧!哈哈
是的,你是对的,看起来这个字符串被假定在Win-1252中。然而,有右单引号(U + 2019)右双引号(U+201D)在字符串中。Win-1252不支持这两个Unicode字符,并将其替换为三个Win-1252字符(其中每个字节解释为单独的Win-1252字符)。
这是一个有趣的讨论,它揭示了很多问题:https://stackoverflow.com/questions/2477452/%C3%A2%E2%82%AC显示在页面上,而不是
这是导致字符串中字符的两个问题:http://www.fileformat.info/info/unicode/char/2019/index.htm和https://www.fileformat.info/info/unicode/char/201d/index.htm
我仍然不确定是FME还是Outlook问题。如果这是一个Outlook问题,则需要使用上面文章中建议的Python修复。如果这个问题是由口蹄疫引起的,我们会把它解决的。我要ping我们的FME服务器专家,让他们调查这个问题。
谢谢你提供的有用信息@LenaAt亚搏在线Safe。
实际上,我以前也经历过堆栈溢出链接。问题是,我们有60多个用户向此电子邮件地址发送电子邮件,而让他们在发送电子邮件时强制编码是不可能的。我也一直在使用python来尝试修复编码,但是我还没有100%的修复,因为它偶尔会显示一些无效字符。
我会坚持下去,看看还能找到什么。我只是好奇,为什么在FME服务器从收件箱中轮询时,编码会被曲解。
©2019安全亚搏在线软件公司法律