色综合天天狠狠,久久精品综合,欧洲亚洲视频

主頁 > 知識庫 > PostgreSQL的中文拼音排序案例

PostgreSQL的中文拼音排序案例

前一段時間開發人員咨詢，說postgresql里面想根據一個字段做中文的拼音排序，但是不得其解

環境：

OS：CentOS 6.3

DB：PostgreSQL 9.2.4

TABLE: tbl_kenyon

場景：

postgres=# \d tbl_kenyon 
  Table "public.tbl_kenyon"
 Column | Type |  Modifiers  
--------+------+---------------
 vname | text |

--使用排序后的結果，不是很理想

postgres=# select vname from tbl_kenyon order by vname;
 vname 
-------
 上海
 北京
 杭州
 浙江
(4 rows)

說明：

postgresql的排序除了受到數據庫的編碼影響外，還有一個初始化參數是locale也會影響(initdb)，,通常我的選擇是C，這可以讓postgres數據庫通過strcmp()這個函數來比較字符串，而不是strcoll()函數。

這個參數可以在數據庫里查看，如

postgres=# \l
                List of databases
   Name    | Owner  | Encoding | Collate | Ctype |  Access privileges  
-----------------+----------+----------+---------+-------+-----------------------
 dkenyon     | u_kenyon | UTF8   | C    | C   | 
 postgres    | postgres | UTF8   | C    | C   | 
 template0    | postgres | UTF8   | C    | C   | =c/postgres     +
         |     |     |     |    | postgres=CTc/postgres
 template1    | postgres | UTF8   | C    | C   | =c/postgres     +
         |     |     |     |    | postgres=CTc/postgres
(6 rows)

--簡體中文在系統表里的支持

postgres=# select collname,collcollate,collctype,b.nspname,c.rolname as collowner 
postgres-# from pg_collation a,pg_namespace b,pg_authid c 
postgres-# where a.collnamespace = b.oid and a.collowner = c.oid and lower(collname) like '%zh_cn%';
  collname  | collcollate | collctype  | nspname  | collowner 
--------------+--------------+--------------+------------+-----------
 zh_CN    | zh_CN    | zh_CN    | pg_catalog | postgres
 zh_CN    | zh_CN.utf8  | zh_CN.utf8  | pg_catalog | postgres
 zh_CN.gb2312 | zh_CN.gb2312 | zh_CN.gb2312 | pg_catalog | postgres
 zh_CN.utf8  | zh_CN.utf8  | zh_CN.utf8  | pg_catalog | postgres
(4 rows)

因為初始化時選擇的locale是C，所以數據庫的默認排序也是C，要想字段內容按照中文拼音排序，需要將UTF8格式存儲的內容轉換為GBK方式。

解決辦法：

1.轉換字段的方式,加個convert_to前綴函數

postgres=# select vname from tbl_kenyon order by convert_to(vname,'GBK');
 vname 
 
-------
 北京
 杭州
 上海
 浙江
(4 rows)

--convert_to函數輸入參數是text形式,輸出編碼是bytea形式，是將字符轉換為目標編碼的函數，如

postgres=# select convert_to('浙江','UTF8'),('浙江','GBK');
  convert_to  |  row   
----------------+------------
 \xe6b599e6b19f | (浙江,GBK)
(1 row)

2.列指定zh_cn的方式存儲

postgres=# alter table tbl_kenyon add cname text collate "zh_CN";
ALTER TABLE
postgres=# \d tbl_kenyon 
  Table "public.tbl_kenyon"
 Column | Type |  Modifiers  
--------+------+---------------
 vname | text | 
 cname | text | collate zh_CN
postgres=# select * from tbl_kenyon;
 vname | cname 
-------+-------
 浙江 | 浙江
 杭州 | 杭州
 上海 | 上海
 北京 | 北京
(4 rows)
postgres=# select * from tbl_kenyon order by vname;
 vname | cname 
-------+-------
 上海 | 上海
 北京 | 北京
 杭州 | 杭州
 浙江 | 浙江
(4 rows)
postgres=# select * from tbl_kenyon order by cname;
 vname | cname 
-------+-------
 北京 | 北京
 杭州 | 杭州
 上海 | 上海
 浙江 | 浙江
(4 rows)

3.查詢時指定collate

postgres=# select * from tbl_kenyon order by vname collate "C";
 vname | cname 
-------+-------
 上海 | 上海
 北京 | 北京
 杭州 | 杭州
 浙江 | 浙江
(4 rows)
postgres=# select * from tbl_kenyon order by vname collate "zh_CN";
 vname | cname 
-------+-------
 北京 | 北京
 杭州 | 杭州
 上海 | 上海
 浙江 | 浙江
(4 rows)

其他問題：

1.在用了方法一的convert_to函數轉換一段時間后，開發告訴我說有異常,報錯 character with byte sequence 0xc2 0xae in encoding "UTF8" has no equivalent in encoding "GBK"

Error querying database. Cause: org.postgresql.util.PSQLException: ERROR: character with byte sequence 0xc2 0xae in
 encoding "UTF8" has no equivalent in encoding "GBK"

排查了一下，發現數據庫里存了一些比較奇怪的字符導致的，比如Mirclereg; city,niwhitereg;town。后對該表重建了一下，用方法二解決,所以convert_to函數使用對一些奇怪的字符轉換時需要注意。

2.對于多音字，仍然會產生一定的歧義，比如重慶，會按Z去排序

上述辦法能滿足大部分漢字的拼音排序，但仍有一些不足。比較理想的解決辦法是對這類基礎數據錄入時就指定拼音規則，或者數據庫里存一份數據的拼音字典來關聯使用。

其他：

使用zh_cn存儲時測試字段大小，未測試取值速度

postgres=# insert into tbl_kenyon select repeat('浙江GDOOASASHOME愛你',5000), repeat('浙江GDOOASASHOME愛你',5000) ;
INSERT 0 1
postgres=# insert into tbl_kenyon select repeat('浙江GDOOASASHOME愛你',50000), repeat('浙江GDOOASASHOME愛你',50000) ;
INSERT 0 1
postgres=# insert into tbl_kenyon select repeat('浙江GDOOASASHOME愛你',100000), repeat('浙江GDOOASASHOME愛你',100000) ;
INSERT 0 1
postgres=# select pg_column_size(cname),pg_column_size(vname) from tbl_kenyon ;
 pg_column_size | pg_column_size 
----------------+----------------
      1410 |      1406
     13769 |     13769
     27506 |     27506
(3 rows)

存儲差異并不大

補充

#高版本可能不支持,或者語法不對？
select * from store order by storename collate 'zh_CN';

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方，望不吝賜教。

您可能感興趣的文章:

PostGreSql 判斷字符串中是否有中文的案例
自定義函數實現單詞排序并運用于PostgreSQL(實現代碼)
PostgreSQL將數據加載到buffer cache中操作方法
在PostgreSQL中使用ltree處理層次結構數據的方法
postgresql 中的時間處理小技巧(推薦)
Postgresql限制用戶登錄錯誤次數的實例代碼
PostgreSQL用戶登錄失敗自動鎖定的處理方案
postgresql影子用戶實踐場景分析
如何使用PostgreSQL進行中文全文檢索

標簽：海西昭通榆林辛集溫州杭州寶雞濮陽

巨人網絡通訊聲明：本文標題《PostgreSQL的中文拼音排序案例》，本文關鍵詞 PostgreSQL,的,中文,拼音,排序,；如發現本文內容存在版權問題，煩請提供相關信息告之我們，我們將及時溝通與處理。本站內容系統采集于網絡，涉及言論、版權與本站無關。

下面列出與本文章《PostgreSQL的中文拼音排序案例》相關的同類信息！

PostgreSQL的中文拼音排序案例

前一段時間開發人員咨詢，說postgresql里面想根據一個字段做中文的拼音排序，但是不得其解環境： OS：CentOS 6.3 DB：PostgreSQL 9.2.4 TABLE: tbl_kenyon 場景： postgres=# \d tbl_kenyon Table "public.tbl...

10-18

400電話的優點和缺點如何申請400電話業務

目前，市場競爭尤為激烈。一些中小企業受到知名大企業的擠壓，競爭力不強。中國的中小企業是一個缺乏個性和成千上萬...

01-12

石家莊電銷機器人穩定嗎（智能電銷機器人好嗎）

本文目錄一覽： 1、電銷機器人作用好不好？2、電銷機器人的作用怎么呀，求大神？3、電銷機器人作用怎么？4、有誰用過電...

11-28

云南電商智能外呼系統商家（云南電子商務公司有哪些）

今天給各位分享云南電商智能外呼系統商家的知識，其中也會對云南電子商務公司有哪些進行解釋，如果能碰巧解決你現在面...

05-16

便捷的電話機器人（電話機器人哪家好）

今日給各位共享快捷的電話機器人的常識，其間也會對電話機器人哪家好進行解說，假如能可巧處理你現在面對的問題，別忘...

06-14

安付電銷機器人（機器人安川銷售）

今日給各位同享安付電銷機器人的常識，其間也會對機器人安川出售進行解說，假如能可巧處理你現在面臨的問題，別忘了重...

11-06

合肥教育群呼電話辦理商家-看這里!

合肥教育群呼電話辦理商家每天連續工作8小時，可以撥打800-1000通電話。工作狀態，人總是會受環境、身體狀況和情緒的影響...

01-16

彩鈴成為400電話的熱選功能有何原因？

400電話已經成為了很多企業通訊工具的首選，在辦理400電話時很多企業會選擇開通400電話的彩鈴功能。彩鈴功能為何會成為企...

12-22

win7系統程序未響應怎么辦如何解決？具體步驟

很多win7用戶碰到過這樣的一個問題，就是提示說程序未響應問題，而后程序就動不了啦!那么對于這個問題要怎么解決呢?現...

10-20

400電話代理與運營商的優勢比較

400電話是全國24小時服務熱線電話，所有400電話由聯通、移動和電信三大運營商提供，辦理該電話有兩個途徑，400電話代理商...

01-13

移動電話打400電話每分鐘多少錢移動400電話怎么辦理？

400電話是一種業務，主要是共同支付。 400電話是一個虛擬號碼，只有綁定手機或固定電話才能使用。 400號主要由聯通、電信...

01-13

銀川電銷外呼系統有效果嗎（外呼系統和電銷卡）

本篇文章給我們談談銀川電銷外呼體系有作用嗎，以及外呼體系和電銷卡對應的知識點，期望對各位有所協助，不要忘了保藏...

11-06

重慶crm外呼系統業務（重慶crm外呼系統業務員招聘）

本文目錄一覽： 1、外呼體系怎樣處理？2、智能外呼體系有哪些功用？3、外呼體系是怎樣用的？4、重慶哪家呼叫中心外包做...

04-22

客服中心呼叫中心搭建注意什么?系統穩定等3點很關鍵

龐大的客服工作需要企業不斷完善服務質量，做到客戶滿意，才能夠創造出更大的價值，所以當客服呼叫系統逐漸被采用的時...

07-12

浙江自動外呼系統有哪些（智能外呼機器）

本篇文章給大家談談浙江自動外呼系統有哪些，以及智能外呼機器對應的知識點，希望對各位有所幫助，不要忘了收藏本站喔...

08-27

MySQL高級特性——數據表分區的概念及機制詳解

目錄分區機制 SELECT 查詢 INSERT 操作 DELETE 操作 UPDATE 操作分區的類型 MySQL 的分區的實現方式是對數據表進行一層包裝，這意...

10-18

福州/武漢/南昌/鎮江白名單防封電銷卡辦理

電銷卡，找卡卡通信，電話。電銷卡，找卡卡通信，電話。福州靠譜電銷卡辦理找卡卡通信辦理上海電銷卡！卡卡通信...

11-23

Win7系統安裝軟件時出現“錯誤1719”的解決辦法

在Windows 7下安裝Office 2010，結果出現錯誤 1719：無法訪問 Windows Installer 服務。沒有正確安裝 Windows Installer 時可能發生這種情...

10-20

溫州餐飲加盟呼叫中心軟件供應商,電話呼叫軟件多少錢-本周熱搜

溫州餐飲加盟呼叫中心軟件供應商,電話呼叫軟件多少錢3.話術錄音方式(是否支持自定義音色音量或上傳實時錄音)。4.自定義...

12-17

安裝win7旗艦版后提示“can not open image file”的故障原因及解決方法

安裝win7旗艦版后提示can not open image file，具體現象如下所示：故障分析：首先can not open image file的意思為不能打開鏡像文件...

10-20

昆明語音外呼系統定制（云南外呼系統）

本文目錄一覽： 1、外呼體系一個多少錢，有哪些功用？2、做電話營銷。一套一鍵外呼體系多少錢？3、AI智能外呼機器人體系...

04-22

VR 教育場景中，課堂融合度很重要

對于有內容呈現需求的領域，都是VR可以落地結合的點所在。具體到教育層面，微視酷 CEO 楊威認為，傳統的教育信息化手段...

10-16

HTML中的圖象標簽屬性

HTML中的圖象標簽屬性圖象可以使網頁更加生動美觀。瀏覽器可以顯示JPEG和GIF圖象，其中GIF圖象最多只能使用256種顏色（即只...

10-18

詳解正則表達式的貪婪模式與非貪婪模式

什么是正則表達式的貪婪與非貪婪匹配如： String str="abcaxc"; Patter p="ab*c"; 貪婪匹配：正則表達式一般趨向于最大長度匹配，...

10-18

東莞防封電銷系統都有什么功能

東莞防封電銷系統都有什么功能電銷系統提供穩定、低價的外呼線路系統，高效率拓客外呼，高頻防封，一鍵撥號，獨家代...

12-15

河北銀行智能外呼系統推薦（銀行智能外呼項目）

本篇文章給咱們談談河北銀行智能外呼體系引薦，以及銀行智能外呼項目對應的知識點，期望對各位有所協助，不要忘了保藏...

11-06

楚雄州電銷機器人（楚雄州機電設備有限公司）

本文目錄一覽： 1、電銷機器人有什么功能2、電銷機器人是什么呢？為什么現在越來越多的企業開始用電銷器人了呢？3、電...

11-27

綿陽電話機器人多少錢一個月(電銷機器人多少錢一個月)

人工智能期間，做德律風發賣的企業為什么老是那么難！面臨偕行競爭老是掉敗，綿陽德律風呆板人幾何錢一個月你有沒有想...

11-26

400客服外包費用打400電話收費標準

自400家電話客戶服務外包公司興起以來，它一直受到大多數合作伙伴的歡迎。原因是客戶服務外包公司可以解決客戶服務招...

01-12

山東電話機器人（青島智能電話機器人）

本篇文章給我們談談山東電話機器人，以及青島智能電話機器人對應的知識點，期望對各位有所協助，不要忘了保藏本站喔。...

05-17

地圖-吸引中國游客波士頓推特制中文地圖受熱捧

中新網4月21日電據美國僑報網編譯報道，波士頓，波士頓公共圖書館(BostonPublicLibrari并不是激進上受推薦的旅游點，但在一張...

04-13

有方機器人代理

智能營銷的新時代到來了。你在等什么？【有方機器人】然后，可以為創建撥打任務。創建撥打任務時，除了話術模板和注...

10-31

迎賓機器人哪家好

4、設定編號說明規則【迎賓機器人】有意通過呼叫任務篩選的客戶可以進行手動操作，也可以在事后由銷售人員進行跟蹤訪...

10-31

用bat實現刪除系統腳本調試程序

刪除一些危險的對象，從根本上解決問題。這些對象對普通用戶是沒什么用的。 1）禁用WSHShell對象，阻止運行程序。刪除或...

10-18

電銷電話卡會被拉黑嗎（電銷卡會影響征信嗎）

本文目錄一覽：1、停機后自動注銷會不會被列入黑名單?2、電銷卡會封號嗎?3、電銷卡是否真的不封號?卡總被停怎么辦回撥真...

07-10

洛陽400電話選正規代理商西安400電話代理商有哪些？

400電話是一個集多種先進通信技術于一體的電話管理系統，擁有全國唯一的10位虛擬號。河南洛陽400電話處理選擇正規代理。...

01-12

西安電銷防封卡怎么樣

西安電銷防封卡怎么樣西安電銷防封卡怎么樣,西安電銷卡怎么樣,西安電銷防封卡,西安電銷卡目前許多行業都在推薦不封號...

06-24

外呼系統防高頻（防高頻呼叫）

本文目錄一覽： 1、外呼體系的焦點是什么？ 2、電銷外呼體系哪個好了？市道上的太多了！有可能推薦的嗎？ 3、哪些電話電...

11-26

包含蕪湖公司電銷系統價格多少的詞條

今日給各位共享蕪湖公司電銷體系價格多少的常識，其間也會對進行解說，假如能可巧處理你現在面對的問題，別忘了重視本...

05-17

如何成為400電話申請代理商,需要具備哪些條件?400電話上海代理商

在過去的兩年里，越來越多的公司或公司開始辦理400電話號碼。這主要是因為400電話的主要功能是將無數的電話號碼連接到...

01-13

廈門電銷卡外呼系統廠家（外呼卡優點）

本文目錄一覽：1、知道電銷客外呼系統好不好嗎?就是廈門那家企業。2、電銷外呼系統品牌排名,哪家好3、現在購買廈門驛路...

07-10

專屬流量是什么意思，專屬流量和通用流量有什么區別嗎？

我們在購買流量卡，會經常聽到一個詞就是“專屬流量”，你知道專屬流量是什么嗎？和通用流量有什么區別呢，接下來我們...

10-13

win10正式版在哪里cortana中個人信息？

cortana是Windows10正式版系統所提供的一項語音識別搜索工具，具有多種基于Bing的搜索功能。無論是在Web中搜索，還是搜索本地...

10-20

阿里云服務器安裝配置tomcat 添加外網訪問端口的教程

阿里云服務器安裝配置tomcat 添加外網訪問端口最近雙十一不是，買了一個阿里云服務器玩玩，但是配置好tomcat，添加安全組...

10-16

400電話申請哪家好?大型代理商有哪些服務優勢?400電話代理商都是一樣的嗎？應該怎樣選擇？

在用戶對400電話申請的時候，也都是需要使用到代理商的，而對于代理商來說，現在也并不是只有一家，所以需要讓用戶進行...

01-13

天津電信ai機器人系統辦理價格-?今日推薦

天津電信ai機器人系統辦理價格電銷機器人多少錢一個，其種的套餐讓您降低獲客成本，不僅是電銷銷售神器，同時也可以在...

01-16

防封號電銷外呼系統公司

當前隨著社會發展節奏的加快，訪問集中、訪問量大、重復問題多發、個性化問題突出等復雜問題如約而至，難以滿足用戶的...

10-26

POS機物聯網專用卡管理平臺這幾個功能太贊了！

物聯網是“十三五”國家戰略性新興產業之一，物聯網的發展帶動了許多其他產業的進步，其中就包括POS機。移動物聯網卡可...

10-13

用美國市場培育中國人才

●編寫計算機代碼的工作人員與真正意義上的軟件工程師有天壤之別。●中國軟件工程師的能力決不輸于美國等發達國家的軟...

10-22

湖南岳陽ai智能電話機器人案件（湖南岳陽ai智能電話機器人案件調查）

本文目錄一覽：1、AI智能通話的原理是什么?2、AI電話機器人防騷擾產品,用AI來對抗AI真的能成功嗎?3、騙子用AI機器人打1700萬...

06-20

如何申請400電話，詳細介紹

如何申請400電話，詳細介紹 400專線專為企事業單位服務。它可以由服務提供商和運營商處理。 1.選擇申請地點：服務商支持...

08-14

PostgreSQL的中文拼音排序案例

10-18

本頁收集關于PostgreSQL的中文拼音排序案例的相關信息資訊供網民參考！

推薦文章

上一篇：關于PostgreSQL 行排序的實例解析

下一篇：postgreSQL數據庫默認用戶postgres常用命令分享

一起分享吧

婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

PostgreSQL的中文拼音排序案例

環境：

場景：

說明：

解決辦法：

其他問題：