Ito ay sumusunod sa orihinal WHATWG opisyal na detalye HTML5.
Parser ay dinisenyo upang hawakan ang lahat ng flavors ng HTML at pina-parse hindi wastong mga dokumento gamit ang well-natukoy na mga patakaran error sa paghawak katugma sa pag-uugali ng mga pangunahing desktop browser ng web.
Ang output ay palced sa loob ng isang punong kahoy na istraktura.
Ito ay sumusuporta sa output sa ElementTree, DOM at lxml puno format pati na rin ang isang simpleng pasadyang format.
HTML5Lib ay nakabalot sa distutils.
HTML5Lib ay magagamit din sa:
Ruby - i-download HTML5Lib para sa Ruby dito .
Python - i-download HTML5Lib para sa mga sawa na dito .
PHP - i-download HTML5Lib para sa PHP dito
Ano ang bago sa release na ito:
- pina-parse. may-bisa at hindi balidong HTML na dokumento sa isang puno
- Suporta para minidom, ElementTree (kabilang cElementTree at lxml.etree), BeautifulSoup (hindi na ginagamit) at custom simpletree output format
- DOM sa saksopon converter
- Reports parse error
- detection Encoding ng karakter
- Filtering at serializing ng puno
- HTML + CSS sanitizer
- Maraming mga pagsusulit unit
Mga Komento hindi natagpuan