English | 简体中文 | 繁體中文 | Русский язык | Français | Español | Português | Deutsch | 日本語 | 한국어 | Italiano | بالعربية

Python简单检测文本类型的2种方法【基于文件头及cchardet库】

Questo esempio spiega il metodo semplice di rilevamento del tipo di testo in Python. Condivido con tutti per riferimento, come segue:

1、Secondo l'intestazione del file.

#Se è un file UTF8 con BOM
def IsUtf8BomFile(pathfile):
  if b'\xef\xbb\xbf' == open(pathfile, mode='rb').read(3)):
    return True
  return False

2、Utilizzare la libreria cchardet.

>>> import cchardet
>>> cchardet.detect(open(pathfile, 'rb').read())
{"encoding": "UTF-8", "confidence": 0.9900000095367432}

Per chi è interessato a ulteriori contenuti relativi a Python, è possibile consultare le sezioni speciali di questo sito: 'Riassunto delle tecniche di gestione dei file e delle directory in Python', 'Riassunto delle tecniche di gestione dei file di testo in Python', 'Riassunto delle tecniche di gestione delle URL in Python', 'Riassunto delle tecniche di gestione delle immagini in Python', 'Manuale di strutture dati e algoritmi in Python', 'Riassunto delle tecniche di programmazione Socket in Python', 'Riassunto delle tecniche di utilizzo delle funzioni in Python', 'Riassunto delle tecniche di gestione delle stringhe in Python' e 'Manuale di入门与进阶经典教程 di Python'.

Spero che il contenuto di questo articolo possa essere utile per la progettazione di programmi Python di tutti.

Dichiarazione: il contenuto di questo articolo è stato tratto da Internet, è di proprietà del rispettivo autore, il contenuto è stato contribuito volontariamente dagli utenti di Internet e caricato autonomamente, questo sito non detiene i diritti di proprietà, non è stato editato manualmente e non assume alcuna responsabilità legale. Se trovi contenuti sospetti di copyright, ti preghiamo di inviare una e-mail a: notice#oldtoolbag.com (al momento dell'invio dell'e-mail, sostituisci # con @) per segnalare il problema e fornire prove pertinenti. Una volta verificata, questo sito eliminerà immediatamente il contenuto sospetto di copyright.