婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 教你使用Python pypinyin庫實現漢字轉拼音

教你使用Python pypinyin庫實現漢字轉拼音

熱門標簽:河北防封卡電銷卡 應電話機器人打電話違法嗎 天津電話機器人公司 電銷機器人的風險 開封自動外呼系統怎么收費 地圖標注線上如何操作 手機網頁嵌入地圖標注位置 開封語音外呼系統代理商 400電話辦理哪種

一、前言

這里我先為大家提供一個中文網站,大家可以下去更深入的學習。

https://pypi.org/project/pypinyin/

pypinyin庫,主要有幾下幾個特性:

  • 智能匹配最正確的拼音;
  • 支持多音字、繁體字;
  • 支持多種不同拼音、注音風格;

該庫屬于第三方Python庫,因此在使用之前,需要提前安裝。

pip install pypinyin

然后,導入該庫即可。

import pypinyin
from pypinyin import pinyin

二、pypinyin庫的使用

先來看一個最基本的例子。

from pypinyin import pinyin
pinyin("吃飯")

結果如下:

有些字,可能是多音字,再看下面這個例子。

from pypinyin import pinyin
pinyin('馮',heteronym=True)
pinyin('朝',heteronym=True)
pinyin('同',heteronym=True)

結果如下:

仔細觀察上述打印結果,生成的都是二維列表嵌套,這樣解析起來,真費勁!

能不能生成一維列表呢?

from pypinyin import lazy_pinyin
lazy_pinyin("數據分析與統計學之美")

結果如下:

問題又來了!

這里雖然是一維列表,但是沒有聲調了,這不尷尬了嗎?

這里面就涉及到一個風格轉換的問題了。

from pypinyin import lazy_pinyin,Style
lazy_pinyin("數據分析與統計學之美",style=Style.TONE)

結果如下:

原來這里有一個Style類,供我們選擇風格,常用的風格有下面這14種。

#: 普通風格,不帶聲調。如: 中國 -> ``zhong guo``
NORMAL  =  0

#: 標準聲調風格,拼音聲調在韻母第一個字母上(默認風格)。如: 中國 -> ``zhōng guó``
TONE  =  1

#: 聲調風格2,即拼音聲調在各個韻母之后,用數字 [1-4] 進行表示。如: 中國 -> ``zho1ng guo2``
TONE2  =  2

#: 聲調風格3,即拼音聲調在各個拼音之后,用數字 [1-4] 進行表示。如: 中國 -> ``zhong1 guo2``
TONE3  =  8

#: 聲母風格,只返回各個拼音的聲母部分(注:有的拼音沒有聲母,詳見 `#27`_)。如: 中國 -> ``zh g``
INITIALS  =  3

#: 首字母風格,只返回拼音的首字母部分。如: 中國 -> ``z g``
FIRST_LETTER  =  4

#: 韻母風格,只返回各個拼音的韻母部分,不帶聲調。如: 中國 -> ``ong uo``
FINALS  =  5

#: 標準韻母風格,帶聲調,聲調在韻母第一個字母上。如:中國 -> ``ōng uó``
FINALS_TONE  =  6

#: 韻母風格2,帶聲調,聲調在各個韻母之后,用數字 [1-4] 進行表示。如: 中國 -> ``o1ng uo2``
FINALS_TONE2  =  7

#: 韻母風格3,帶聲調,聲調在各個拼音之后,用數字 [1-4] 進行表示。如: 中國 -> ``ong1 uo2``
FINALS_TONE3  =  9

#: 注音風格,帶聲調,陰平(第一聲)不標。如: 中國 -> ``ㄓㄨㄥ ㄍㄨㄛˊ``
BOPOMOFO  =  10

#: 注音風格,僅首字母。如: 中國 -> ``ㄓ ㄍ``
BOPOMOFO_FIRST  =  11

#: 漢語拼音與俄語字母對照風格,聲調在各個拼音之后,用數字 [1-4] 進行表示。如: 中國 -> ``чжун1 го2``
CYRILLIC  =  12

#: 漢語拼音與俄語字母對照風格,僅首字母。如: 中國 -> ``ч г``
CYRILLIC_FIRST  =  13

如果你的文字中,除了漢字,還有其它符號以及英文,會打印出怎么樣的效果呢?

from pypinyin import lazy_pinyin
lazy_pinyin('Hello,我是😀',style=Style.TONE)

結果如下:

漢字打印出來就行,英文、表情符號不用打印出來最好,應該怎么辦呢?

這里有一個errors參數呢,來看看例子。

from pypinyin import lazy_pinyin

lazy_pinyin('Hello,我是😀',style=Style.TONE,errors='ignore')

結果如下:

如果你對pypinyin庫的返回結果不滿意,可以自定義一個庫呀!這里可以使用load_phrases_dict 方法。

我們先來看一個例子:

from pypinyin import lazy_pinyin

lazy_pinyin("黃同學",style=Style.TONE)

結果如下:

“黃同學” 的同,明明是二聲,這里成了四聲。

from pypinyin import lazy_pinyin,  load_phrases_dict

personalized_dict = {'黃同學':  [['huáng'], ['tòng'], ['xué']]}

load_phrases_dict(personalized_dict)

lazy_pinyin("黃同學",style=Style.TONE)

結果如下:

到此這篇關于教你使用Python pypinyin庫實現漢字轉拼音的文章就介紹到這了,更多相關Python pypinyin庫內容請搜索腳本之家以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • python 實用工具狀態機transitions
  • 簡單理解Python中基于生成器的狀態機
  • 狀態機的概念和在Python下使用狀態機的教程
  • 淺談python中常用的excel模塊庫
  • Python 中拼音庫 PyPinyin 用法詳解
  • python munch庫的使用解析
  • Python爬蟲基礎之selenium庫的用法總結
  • python爬蟲之selenium庫的安裝及使用教程
  • python狀態機transitions庫詳解

標簽:宿遷 成都 六盤水 常州 江蘇 駐馬店 山東 蘭州

巨人網絡通訊聲明:本文標題《教你使用Python pypinyin庫實現漢字轉拼音》,本文關鍵詞  教你,使用,Python,pypinyin,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《教你使用Python pypinyin庫實現漢字轉拼音》相關的同類信息!
  • 本頁收集關于教你使用Python pypinyin庫實現漢字轉拼音的相關信息資訊供網民參考!
  • 推薦文章
    主站蜘蛛池模板: 焦作市| 门头沟区| 山阴县| 伊通| 翁源县| 娱乐| 建瓯市| 临清市| 康马县| 西藏| 锡林浩特市| 廊坊市| 慈利县| 江源县| 和田市| 天台县| 区。| 盐边县| 汨罗市| 弥勒县| 辽宁省| 宜丰县| 易门县| 正宁县| 扎赉特旗| 来安县| 冕宁县| 瑞丽市| 收藏| 兰州市| 章丘市| 庆安县| 赞皇县| 中西区| 巫溪县| 云南省| 乐业县| 马鞍山市| 绥宁县| 广元市| 盖州市|