這幾天和同事在討論,如何用 Python 寫出優雅的讓列表中的列表展開,變成扁平化的列表。
例如
# 期望輸入
input = [[('A', 1), ('B', 2)], [('C', 3), ('D', 4)]]
# 期望輸出
output = [('A', 1), ('B', 2), ('C', 3), ('D', 4)]
map 函數合并
>>> new = []; map(new.extend, input); new
[None, None]
[('A', 1), ('B', 2), ('C', 3), ('D', 4)]
這個方法看上去還可以,但是有個致命的缺點,就是map函數會返回值,并且這個返回值是沒有用的。另外還需要提前聲明一個變量,從代碼的簡潔性上,不夠簡潔優雅。
sum 函數合并
>>> sum(input, [])
[('A', 1), ('B', 2), ('C', 3), ('D', 4)]
這個看上去很簡潔,不過有類似字符串累加的性能陷阱。后面有性能對比。
reduce 函數
>>> reduce(list.__add__, input)
[('A', 1), ('B', 2), ('C', 3), ('D', 4)]
做序列的累加操作。也是有累加的性能陷阱。
列表推導式
>>> [item for sublist in input for item in sublist]
[('A', 1), ('B', 2), ('C', 3), ('D', 4)]
列表推導式,看著有些長,而且還要for循環兩次,變成一行理解需要費勁一些,沒有那么直觀。
itertools 類庫
>>> list(itertools.chain(*input))
[('A', 1), ('B', 2), ('C', 3), ('D', 4)]
通過第三方類庫類實現的,相比其他的幾個實現,看著還算比較優雅。最后的性能發現居然還很高。
性能大對比
python -mtimeit -s'l=[[1,2,3],[4,5,6], [7], [8,9]]*99' 'reduce(list.__add__,l)'
1000 loops, best of 3: 547 usec per loop
python -mtimeit -s'l=[[1,2,3],[4,5,6], [7], [8,9]]*99' 'sum(l, [])'
1000 loops, best of 3: 509 usec per loop
python -mtimeit -s'l=[[1,2,3],[4,5,6], [7], [8,9]]*99' '[item for sublist in l for item in sublist]'
10000 loops, best of 3: 52.8 usec per loop
python -mtimeit -s'l=[[1,2,3],[4,5,6], [7], [8,9]]*99; import itertools;' 'list(itertools.chain(*l))'
10000 loops, best of 3: 35.9 usec per loop
python -mtimeit -s'l=[[1,2,3],[4,5,6], [7], [8,9]]*99' 'new = []; map(new.extend, l); new'
10000 loops, best of 3: 34.1 usec per loop
歡迎大家共同探討優雅的的實現和性能的優化。
補充:python 將(含嵌套的)dict平鋪展開
話不多說,直接上代碼:
def prefix_dict(di_, prefix_s=''):
"""
把字典的每個key都帶上前綴prefix_s
:param di_:
:param prefix_s:
:return:
"""
return {prefix_s + k: v for k, v in di_.items()}
def spear_dict(di_, con_s='.'):
"""
展開dict(如果下層還是dict),需要遞歸,展開到下層的數據類型不是字典為止
可能實用的地方:將文檔類的數據格式化成更加關系化的樣子可能有用
:param di_: 輸入字典
:param con_s: 層級間的連接符號
:return: 深度不大于1的字典,嵌套的其他數據類型照舊
"""
ret_di = {}
for k, v in di_.items():
if type(v) is dict:
v = spear_dict(v)
# 這里或許有不寫到這一層的更好寫法
# for k_, v_ in v.items():
# ret_di.update({con_s.join([k, k_]): v_})
ret_di.update(prefix_dict(v, prefix_s=k + con_s))
else:
ret_di.update({k: v})
return ret_di
>>> di_
{'title': '新田商業街', 'reliability': 7, 'addressComponents': {'streetNumber': '', 'city': '深圳市', 'street': '', 'province': '廣東省', 'district': '龍華區'}, 'location': {'lng': 114.09127044677734, 'lat': 22.700519561767578}, 'adInfo': {'adcode': '440309'}, 'level': 11, 'more_deep': {'loca': {'lng': 114.09127044677734, 'lat': 22.700519561767578}}}
>>> spear_dict(di_)
{'title': '新田商業街', 'reliability': 7, 'addressComponents.streetNumber': '', 'addressComponents.city': '深圳市', 'addressComponents.street': '', 'addressComponents.province': '廣東省', 'addressComponents.district': '龍華區', 'location.lng': 114.09127044677734, 'location.lat': 22.700519561767578, 'adInfo.adcode': '440309', 'level': 11, 'more_deep.loca.lng': 114.09127044677734, 'more_deep.loca.lat': 22.700519561767578}
spear_dict(di_, '_')
{'title': '新田商業街', 'reliability': 7, 'addressComponents_streetNumber': '', 'addressComponents_city': '深圳市', 'addressComponents_street': '', 'addressComponents_province': '廣東省', 'addressComponents_district': '龍華區', 'location_lng': 114.09127044677734, 'location_lat': 22.700519561767578, 'adInfo_adcode': '440309', 'level': 11, 'more_deep_loca.lng': 114.09127044677734, 'more_deep_loca.lat': 22.700519561767578}
以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
您可能感興趣的文章:- python中必會的四大高級數據類型(字符,元組,列表,字典)
- Python列表刪除重復元素與圖像相似度判斷及刪除實例代碼
- Python 統計列表中重復元素的個數并返回其索引值的實現方法
- Python基礎詳解之列表復制
- 淺談Python列表嵌套字典轉化的問題
- Python隨機函數random隨機獲取數字、字符串、列表等使用詳解
- Python列表排序方法reverse、sort、sorted詳解
- Python3 列表list合并的4種方法
- python獲取指定時間段內特定規律的日期列表
- python實現合并兩個有序列表的示例代碼
- python求列表對應元素的乘積和的實現
- Python統計列表元素出現次數的方法示例
- python 合并列表的八種方法
- python 列表元素左右循環移動 的多種解決方案
- Python列表排序 list.sort方法和內置函數sorted用法
- 淺談Python基礎之列表那些事兒