斯潘8
斯潘4
阿诺德评论·
同意,只要遵守当地和特定语言的惯例。例如,在某些语言中,带重音符号/音调符号的字母被认为是独立的字母,可能跟在或不跟在它们的基字母后面。例如:
戴维德评论·
这真的需要实施,事实上,对于非英语语言来说,分拣机几乎是无用的。
如果表现太差,可以考虑使用两种不同的字母数字排序,一个基于字节顺序,另一个使用区域设置排序顺序(完全支持Unicode)。
可能还支持按语言组自定义排序顺序,看见https://msdn.microsoft.com/en-us/library/windows/desktop/dd374060%28v=vs.85%29.aspx?F=255&mspperror=-2147217396
戴维德评论·
将fmeobjectsimport unicodedata导入为ud
def rmdiacritics(char):''返回char的基字符,通过“删除”任何音调符号,如重音符号、卷发、笔画等。''desc=ud.name(unicode(char))cutoff=desc.find('with')if cutoff!=-1:desc=desc[:cutoff]返回ud.查找(desc)
def removeaccents(feature):属性_list=(名称“,“类型”“state”)根据需要修改feature.getAllattributeNames()中的attrib:if attrib-in-attribute:value=feature.getattribute(attrib)if-value:value=unicode(value)new_value='.join([rmdiacritics(char)for char-in-value])feature.setattribute(attrib,Nexy值
分享你的好主意,或者投票支持别人的想法。
?2019安全亚搏在线软件公司|合法的