code学习

生僻字“拦路”公共服务,解法来了

作者:财经新媒体

全国有超6000万人名中包含生僻字,其使用不便难题,近年来引发多方关注。

不久前,一位女士办理落户时,被自己的姓氏卡住了。身份证上,她姓“闫”,读初中创建学籍,当时电脑打不出这个字,用“阎”替代,高中大学毕业证上也沿用了该字。落户不成,在于两证信息不一致,本科学历无法认证。

有人名字里带“䶮”,寓意飞龙在天,因系统无法识别这个生僻字,申请信用卡电话卡之类,身份证信息读取成了麻烦事,得提供各种材料人工审核,才能完成实名认证。为避免此类状况,他只好改名,用同音字“衍”代替。

多位人大代表和政协委员数次提案,认为生僻字不该成为公共服务的“拦路虎”,希望各部门、行业的信息系统尽快完成支持生僻字改造,尽快为姓名含有生僻字的公民消除“数字鸿沟”。

生僻字“拦路”公共服务,解法来了

这是汉字数字化过程中的一大难题,体系化改造难度高、周期长、相关方众多。

其不仅涉及环节多,生僻字可能出现在输入、存储、显示等多个环节;而且涉及系统多,各行业各机构使用操作系统不同,信息软件不一,为适配生僻字输入与显示,都得做相应升级。由于标准覆盖不足,部分机构因实际业务需要,以自定义方式给生僻字编码,造成了“一字多码”情况。

正因如此,这也是一个需要多方参与,共建标准化使用的过程,而输入法正是其中的关键环节。腾讯搜狗输入法给出了“三步法”。

完善自身产品适配生僻字的改造,消解生僻字输入障碍是第一步。

今年7月,国家市场监管总局发布《信息技术 中文编码字符集》强制性国家标准(GB 18030-2022),要求到2023年8月1日,政务服务和公共服务的产品与系统要支持标准内的87887个汉字。今年11月,腾讯搜狗输入法宣布在行业率先支持移动端超过9万个汉字输入。

针对C端用户只识字形、不知读音的情况,腾讯搜狗输入法近期开发了“生僻字键盘”,通过“拆字”,实现笔画输入、拆分部首的拼音输入,以及部首拼音+笔画的混合输入3种便捷输入。

生僻字“拦路”公共服务,解法来了

腾讯搜狗输入法“生僻字键盘”示意图

对无法输入的生僻字,进一步查漏补缺,打通生僻字从征集、考证、赋码,到扩容国标、字形设计的数字链路,这是第二步。

在字库“扩容”基础上,腾讯搜狗输入法联合工信部电子工业标准化研究院、汉仪字库,共同发起“汉字守护计划”公益行动,在APP新增的“生僻字征集”功能,面向大众征集在“扩容”后,仍无法打出的生僻字。

这些生僻字将由工信部电子工业标准化研究院进行价值及学术考证,经过技术和标准化流程审查后,赋予相应编码并收录国标字库;腾讯搜狗输入法随之完成适配,汉仪字库为新编码汉字设计字形,从而实现用户在电脑、手机等信息系统中输入并显示目标生僻字。

基于生僻字改造的经验沉淀,集成公共服务行业生僻字改造方案,面向垂直领域推广,是为第三步。

金融行业是信息化程度最高的行业之一,规范生僻字输入、显示、信息交换、存储等环节的使用也至关重要。2022年6月,中国人民银行正式印发《金融服务 生僻字处理指南》(JR/T 0253—2022)金融行业标准。

在该政策指导下,北京国家金融标准化研究院与腾讯搜狗输入法携手,共同打造了面向金融领域定制化的生僻字解决方案——金标输入法,融入金融行业专属词库、定制金融键盘等诸多能力。

生僻字“拦路”公共服务,解法来了

针对金融公共服务场景中,用户跨终端输入生僻字的情况,搜狗输入法还推出了“云输入法”。以银行App为例,生僻字无法输入显示的原因之一,是用户端本地没有可支持的字体包。如若在App内置完整字体包,又会使应用占用内存过大。

“云输入法”的解决思路是,将字体包存储在App的云服务器上,同时与有生僻字输入需求的各个环节打通。用户在姓名输入框内打出一个生僻字,后台便会从云服务器,下载对应字的单个字体到本地。

无论是用浏览器打开银行网页端,还是手机登陆银行App端,云输入都可以支持用户输入生僻字。跨端同时,用户数据部署在银行内网,也让整套链路的安全有保障。

在腾讯搜狗输入法的路线图上,从输入环节切入,不断完善公共服务行业的生僻字改造方案,除了金融行业,未来还会向交通、能源等领域推广,解决生僻字难题。

自我完善,由内及外,多方共建,为弥合生僻字使用的“数字鸿沟”,腾讯搜狗输入法走在了前面。

《财经》新媒体综编

继续阅读