婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 詳解python字符串駐留技術

詳解python字符串駐留技術

熱門標簽:沈陽防封電銷卡品牌 外呼系統哪些好辦 武漢外呼系統平臺 沈陽外呼系統呼叫系統 如何申請400電話費用 江西省地圖標注 富錦商家地圖標注 沈陽人工外呼系統價格 池州外呼調研線路

前言

每種編程語言為了表現出色,并且實現卓越的性能,都需要有大量編譯器級與解釋器級的優化。

由于字符串是任何編程語言中不可或缺的一個部分,因此,如果有快速操作字符串的能力,就可以迅速地提高整體的性能。

在本文中,我們將深入研究 Python 的內部實現,并了解 Python 如何使用一種名為字符串駐留(String Interning)的技術,實現解釋器的高性能。本文的目的不僅在于介紹 Python 的內部知識,而且還旨在使讀者能夠輕松地瀏覽 Python 的源代碼;因此,本文中將有很多出自CPython的代碼片段。

全文提綱如下:

1、什么是“字符串駐留”?

字符串駐留是一種編譯器/解釋器的優化方法,它通過緩存一般性的字符串,從而節省字符串處理任務的空間和時間。

這種優化方法不會每次都創建一個新的字符串副本,而是僅為每個適當的不可變值保留一個字符串副本,并使用指針引用之。每個字符串的唯一拷貝被稱為它的intern,并因此而得名 String Interning。

String Interning 一般被譯為“字符串駐留”或“字符串留用”,在某些語言中可能習慣用 String Pool(字符串常量池)的概念,其實是對同一種機制的不同表述。intern 作為名詞時,是“實習生、實習醫生”的意思,在此可以理解成“駐留物、駐留值”。

查找字符串 intern 的方法可能作為公開接口公開,也可能不公開。現代編程語言如 Java、Python、PHP、Ruby、Julia 等等,都支持字符串駐留,以使其編譯器和解釋器做到高性能。

2、為什么要駐留字符串?

字符串駐留提升了字符串比較的速度。如果沒有駐留,當我們要比較兩個字符串是否相等時,它的時間復雜度將上升到 O(n),即需要檢查兩個字符串中的每個字符,才能判斷出它們是否相等。

但是,如果字符串是固定的,由于相同的字符串將使用同一個對象引用,因此只需檢查指針是否相同,就足以判斷出兩個字符串是否相等,不必再逐一檢查每個字符。由于這是一個非常普遍的操作,因此,它被典型地實現為指針相等性校驗,僅使用一條完全沒有內存引用的機器指令。

字符串駐留減少了內存占用。Python 避免內存中充斥多余的字符串對象,通過享元設計模式共享和重用已經定義的對象,從而優化內存占用。

3、Python的字符串駐留

像大多數其它現代編程語言一樣,Python 也使用字符串駐留來提高性能。在 Python 中,我們可以使用is運算符,檢查兩個對象是否引用了同一個內存對象。

因此,如果兩個字符串對象引用了相同的內存對象,則is運算符將得出True,否則為False。

 >>> 'python' is 'python'

  True

我們可以使用這個特定的運算符,來判斷哪些字符串是被駐留的。在 CPython 的,字符串駐留是通過以下函數實現的,聲明在 unicodeobject.h 中,定義在 unicodeobject.c 中。

PyAPI_FUNC(void) PyUnicode_InternInPlace(PyObject **);

為了檢查一個字符串是否被駐留,CPython 實現了一個名為PyUnicode_CHECK_INTERNED的宏,同樣是定義在 unicodeobject.h 中。

這個宏表明了 Python 在PyASCIIObject結構中維護著一個名為interned的成員變量,它的值表示相應的字符串是否被駐留。

#define PyUnicode_CHECK_INTERNED(op) \

      (((PyASCIIObject *)(op))->state.interned)

4、字符串駐留的原理

在 CPython 中,字符串的引用被一個名為interned的 Python 字典所存儲、訪問和管理。 該字典在第一次調用字符串駐留時,被延遲地初始化,并持有全部已駐留字符串對象的引用。

4.1 如何駐留字符串?

負責駐留字符串的核心函數是PyUnicode_InternInPlace,它定義在 unicodeobject.c 中,當調用時,它會創建一個準備容納所有駐留的字符串的字典interned,然后登記入參中的對象,令其鍵和值都使用相同的對象引用。

以下函數片段顯示了 Python 實現字符串駐留的過程。

void
  PyUnicode_InternInPlace(PyObject **p)
  {
      PyObject *s = *p;
  ​
      .........
  ​
      // Lazily build the dictionary to hold interned Strings
      if (interned == NULL) {
          interned = PyDict_New();
          if (interned == NULL) {
              PyErr_Clear();
              return;
          }
      }
  ​
      PyObject *t;
  ​
      // Make an entry to the interned dictionary for the
      // given object
      t = PyDict_SetDefault(interned, s, s);
  ​
      .........
 
      // The two references in interned dict (key and value) are
      // not counted by refcnt.
      // unicode_dealloc() and _PyUnicode_ClearInterned() take
      // care of this.
      Py_SET_REFCNT(s, Py_REFCNT(s) - 2);
  ​
      // Set the state of the string to be INTERNED
      _PyUnicode_STATE(s).interned = SSTATE_INTERNED_MORTAL;
  }

4.2 如何清理駐留的字符串?

清理函數從interned字典中遍歷所有的字符串,調整這些對象的引用計數,并把它們標記為NOT_INTERNED,使其被垃圾回收。一旦所有的字符串都被標記為NOT_INTERNED,則interned字典會被清空并刪除。

這個清理函數就是_PyUnicode_ClearInterned,在unicodeobject.c 中定義。

void
  _PyUnicode_ClearInterned(PyThreadState *tstate)
  {
      .........
  ​
      // Get all the keys to the interned dictionary
      PyObject *keys = PyDict_Keys(interned);
  ​
      .........
  ​
      // Interned Unicode strings are not forcibly deallocated;
      // rather, we give them their stolen references back
      // and then clear and DECREF the interned dict.
  ​
      for (Py_ssize_t i = 0; i  n; i++) {
          PyObject *s = PyList_GET_ITEM(keys, i);
  ​
          .........
  ​
          switch (PyUnicode_CHECK_INTERNED(s)) {
          case SSTATE_INTERNED_IMMORTAL:
              Py_SET_REFCNT(s, Py_REFCNT(s) + 1);
              break;
          case SSTATE_INTERNED_MORTAL:
              // Restore the two references (key and value) ignored
              // by PyUnicode_InternInPlace().
              Py_SET_REFCNT(s, Py_REFCNT(s) + 2);
              break;
          case SSTATE_NOT_INTERNED:
              /* fall through */
          default:
              Py_UNREACHABLE();
          }
  ​
          // marking the string to be NOT_INTERNED
          _PyUnicode_STATE(s).interned = SSTATE_NOT_INTERNED;
      }
  ​
      // decreasing the reference to the initialized and
      // access keys object.
      Py_DECREF(keys);
  ​
      // clearing the dictionary
      PyDict_Clear(interned);
  ​
      // clearing the object interned
      Py_CLEAR(interned);
  }

5、字符串駐留的實現

既然了解了字符串駐留及清理的內部原理,我們就可以找出 Python 中所有會被駐留的字符串。

為了做到這點,我們要做的就是在 CPython 源代碼中查找PyUnicode_InternInPlace 函數的調用,并查看其附近的代碼。下面是在 Python 中關于字符串駐留的一些有趣的發現。

5.1 變量、常量與函數名

CPython 對常量(例如函數名、變量名、字符串字面量等)執行字符串駐留。

以下代碼出自codeobject.c,它表明在創建新的PyCode對象時,解釋器將對所有編譯期的常量、名稱和字面量進行駐留。

PyCodeObject *
  PyCode_NewWithPosOnlyArgs(int argcount, int posonlyargcount, int kwonlyargcount,
                            int nlocals, int stacksize, int flags,
                            PyObject *code, PyObject *consts, PyObject *names,
                            PyObject *varnames, PyObject *freevars, PyObject *cellvars,
                            PyObject *filename, PyObject *name, int firstlineno,
                            PyObject *linetable)
  {
  ​
      ........
  ​
      if (intern_strings(names)  0) {
          return NULL;
      }
  ​
      if (intern_strings(varnames)  0) {
          return NULL;
      }
  ​
      if (intern_strings(freevars)  0) {
          return NULL;
      }
  ​
      if (intern_strings(cellvars)  0) {
          return NULL;
      }
  ​
      if (intern_string_constants(consts, NULL)  0) {
          return NULL;
      }
  ​
      ........
  ​
  }

5.2 字典的鍵

CPython 還會駐留任何字典對象的字符串鍵。

當在字典中插入元素時,解釋器會對該元素的鍵作字符串駐留。以下代碼出自dictobject.c,展示了實際的行為。

有趣的地方:在PyUnicode_InternInPlace函數被調用處有一條注釋,它問道,我們是否真的需要對所有字典中的全部鍵進行駐留?

int
  PyDict_SetItemString(PyObject *v, const char *key, PyObject *item)
  {
      PyObject *kv;
      int err;
      kv = PyUnicode_FromString(key);
      if (kv == NULL)
          return -1;
  ​
      // Invoking String Interning on the key
      PyUnicode_InternInPlace(kv); /* XXX Should we really? */
  ​
      err = PyDict_SetItem(v, kv, item);
      Py_DECREF(kv);
      return err;
  }

5.3 任何對象的屬性

Python 中對象的屬性可以通過setattr函數顯式地設置,也可以作為類成員的一部分而隱式地設置,或者在其數據類型中預定義。

CPython 會駐留所有這些屬性名,以便實現快速查找。以下是函數PyObject_SetAttr的代碼片段,該函數定義在文件object.c中,負責為 Python 對象設置新屬性。

int
  PyObject_SetAttr(PyObject *v, PyObject *name, PyObject *value)
  {
  ​
      ........
  ​
      PyUnicode_InternInPlace(name);
  ​
      ........
  }

5.4 顯式地駐留

Python 還支持通過sys模塊中的intern函數進行顯式地字符串駐留。

當使用任何字符串對象調用此函數時,該字符串對象將被駐留。以下是sysmodule.c文件的代碼片段,它展示了在sys_intern_impl函數中的字符串駐留過程。

static PyObject *
  sys_intern_impl(PyObject *module, PyObject *s)
  {
  ​
      ........
  ​
      if (PyUnicode_CheckExact(s)) {
          Py_INCREF(s);
          PyUnicode_InternInPlace(s);
          return s;
      }
  ​
      ........
  }

6、字符串駐留的其它發現

只有編譯期的字符串會被駐留。在解釋時或編譯時指定的字符串會被駐留,而動態創建的字符串則不會。

Python貓注:這一條規則值得展開思考,我曾經在上面踩過坑……有兩個知識點,我相信 99% 的人都不知道:字符串的 join() 方法是動態創建字符串,因此其創建的字符串不會被駐留;常量折疊機制也發生在編譯期,因此有時候容易把它跟字符串駐留搞混淆。推薦閱讀《join()方法的神奇用處與Intern機制的軟肋》

包含 ASCII 字符和下劃線的字符串會被駐留。在編譯期間,當對字符串字面量進行駐留時,CPython確保僅對匹配正則表達式[a-zA-Z0-9_]*的常量進行駐留,因為它們非常貼近于 Python 的標識符。

注:關于 Python 中標識符的命名規則,在 Python2 版本只有“字母、數字和下劃線”,但在 Python 3.x 版本中,已經支持 Unicode 編碼。這部分內容推薦閱讀《醒醒!Python已經支持中文變量名啦!》

以上就是詳解python字符串駐留技術的詳細內容,更多關于python字符串駐留技術的資料請關注腳本之家其它相關文章!

您可能感興趣的文章:
  • python字符串的多行輸出的實例詳解
  • python列表和字符串的三種逆序遍歷操作
  • python 如何比較字符串是否一樣
  • python str()如何將參數轉換為字符串類型
  • 教你怎么用python實現字符串轉日期
  • 如何使用python提取字符串的中英文(正則判斷)
  • python 如何將帶小數的浮點型字符串轉換為整數
  • Python的字符串示例講解
  • python生成隨機數、隨機字符、隨機字符串的方法示例
  • python如何正確的操作字符串

標簽:黑龍江 常德 阿里 潛江 呂梁 通遼 銅川 株洲

巨人網絡通訊聲明:本文標題《詳解python字符串駐留技術》,本文關鍵詞  詳解,python,字符串,駐留,;如發現本文內容存在版權問題,煩請提供相關信息告之我們,我們將及時溝通與處理。本站內容系統采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《詳解python字符串駐留技術》相關的同類信息!
  • 本頁收集關于詳解python字符串駐留技術的相關信息資訊供網民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    麻豆国产欧美一区二区三区| 国产精品传媒入口麻豆| 欧美日韩一区成人| 国产精品久久免费看| 国产成人精品影视| 国产欧美日韩另类一区| 国产一区二区三区免费观看| 精品国产伦一区二区三区观看方式| 午夜视频一区在线观看| 欧美精品久久99久久在免费线| 日韩精品福利网| 日韩欧美高清在线| 国产传媒一区在线| 一区二区国产盗摄色噜噜| 91国偷自产一区二区开放时间 | 亚洲第一精品在线| 在线视频欧美区| 日韩在线观看一区二区| 日韩免费看的电影| 成人av午夜电影| 亚洲精品欧美综合四区| 在线国产亚洲欧美| 国产在线播放一区三区四| 中文字幕一区在线观看视频| 欧美日韩激情一区二区三区| 国产一区二区三区在线看麻豆| 最新欧美精品一区二区三区| 91麻豆精品国产自产在线观看一区 | 正在播放一区二区| 久久国产福利国产秒拍| 国产精品妹子av| 欧美一区二区三区视频在线观看| 国产一区不卡在线| 亚洲黄一区二区三区| 欧美不卡在线视频| 欧美色综合久久| 成人午夜大片免费观看| 免费xxxx性欧美18vr| 亚洲视频一区二区在线观看| 日韩精品中午字幕| 欧美日韩一区国产| 99精品视频在线免费观看| 亚洲成人动漫在线免费观看| 中文字幕永久在线不卡| 精品国产乱码久久久久久久| 欧美性猛片aaaaaaa做受| 国产98色在线|日韩| 美国毛片一区二区| 午夜精品福利一区二区蜜股av| 国产精品久久久久一区| 久久久久久久综合| 久久影院电视剧免费观看| 3d成人动漫网站| 欧美日韩国产乱码电影| 91福利国产成人精品照片| 成人精品免费视频| 国产乱人伦偷精品视频免下载 | 在线观看91av| 国产精品1024久久| 另类综合日韩欧美亚洲| 亚洲福利一区二区三区| 亚洲色图视频网| 自拍偷拍国产精品| 亚洲欧洲av在线| 国产精品色噜噜| 国产亚洲一区二区三区在线观看| 精品精品国产高清a毛片牛牛 | 亚洲观看高清完整版在线观看| 国产精品久久福利| **性色生活片久久毛片| 国产精品天天摸av网| 国产精品系列在线| 亚洲色图视频网站| 夜夜嗨av一区二区三区网页| 亚洲综合激情另类小说区| 亚洲综合图片区| 亚洲r级在线视频| 日本美女一区二区三区| 久久99国产精品尤物| 国产一区二区三区四区五区美女| 国内外成人在线视频| 国产一区二区福利视频| av亚洲精华国产精华精华| 在线视频综合导航| 精品久久人人做人人爰| 日本一区免费视频| 亚洲精品第1页| 亚洲成人激情综合网| 麻豆国产欧美日韩综合精品二区| 久久国内精品视频| 色婷婷久久99综合精品jk白丝| 在线亚洲人成电影网站色www| 欧美一级淫片007| 国产日韩精品视频一区| 亚洲精品老司机| 久久精品久久精品| 99精品久久99久久久久| 欧美日韩mp4| 久久久美女艺术照精彩视频福利播放| 中文字幕电影一区| 亚洲一区二区三区视频在线播放 | 欧美一级午夜免费电影| 国产欧美一区二区三区鸳鸯浴| 一卡二卡三卡日韩欧美| 国内国产精品久久| 欧美综合一区二区| 久久久99久久| 日韩精品国产欧美| 91亚洲精品久久久蜜桃| 精品久久99ma| 亚洲一区二区三区爽爽爽爽爽| 国产精品99久久不卡二区| 欧美日韩国产高清一区二区三区 | 精品一区二区三区久久| 一本久道久久综合中文字幕 | 亚洲视频在线一区| 美女高潮久久久| 欧美日韩一级片在线观看| 欧美激情中文不卡| 老司机午夜精品| 6080yy午夜一二三区久久| 一区二区三区资源| 99在线精品观看| 国产精品视频免费看| 精品中文av资源站在线观看| 欧美精品黑人性xxxx| 一区二区三区日韩精品| 99国产精品国产精品毛片| 久久综合久久鬼色| 久久er精品视频| 欧美大片国产精品| 肉色丝袜一区二区| 在线电影欧美成精品| 亚洲国产精品一区二区久久恐怖片| 成人免费黄色大片| 中日韩免费视频中文字幕| 国产成人午夜99999| 国产天堂亚洲国产碰碰| 国产一区在线观看视频| 久久久久久久综合色一本| 国产剧情一区二区| 久久伊99综合婷婷久久伊| 麻豆91精品91久久久的内涵| 91麻豆精品国产91久久久更新时间 | 欧美体内she精高潮| 亚洲最大成人网4388xx| 欧美影片第一页| 亚洲日本在线a| 国产做a爰片久久毛片| 国产亚洲综合在线| 国产99久久久久久免费看农村| 最近日韩中文字幕| 韩国女主播一区| 中文字幕一区二区三区av| 99久久婷婷国产综合精品电影 | 日本一区二区高清| 色综合色综合色综合色综合色综合| 亚洲精品国产品国语在线app| 欧美日韩视频在线一区二区| 久久99九九99精品| 国产精品沙发午睡系列990531| av一区二区三区黑人| 午夜天堂影视香蕉久久| 欧美成人午夜电影| 99视频热这里只有精品免费| 亚洲成av人片在线| 久久亚洲免费视频| 欧美最新大片在线看| 国产在线观看一区二区| 亚洲午夜精品17c| 国产亚洲一区二区三区在线观看 | 欧美在线一二三四区| 另类欧美日韩国产在线| 亚洲精品欧美专区| 亚洲精品在线电影| 欧美午夜视频网站| 国产69精品久久777的优势| 夜夜精品浪潮av一区二区三区| 日韩写真欧美这视频| 成人开心网精品视频| 久久成人免费电影| 亚洲国产aⅴ天堂久久| 国产精品伦理一区二区| 日韩精品中文字幕一区| 欧美在线不卡视频| 成人a免费在线看| 久久机这里只有精品| 亚洲成人av福利| 亚洲免费在线电影| 国产精品天美传媒| 国产午夜精品福利| 欧美大片一区二区| 欧美一区二区三区婷婷月色| 91在线小视频| 国产一区视频导航| 日日夜夜免费精品| 亚洲一区二区成人在线观看| **网站欧美大片在线观看| 久久久久久久久久久久久久久99| 777久久久精品|