Python提取网页中超链接的方法

Ecco il metodo più semplice di implementazione, prima di tutto, cattura la pagina obiettivo, quindi ottieni gli hyperlink dall'attributo href degli a tag tramite l'abbinamento regolare

Il codice è il seguente:

import urllib2
import re
url = 'http://www.sunbloger.com/'
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
links = re.findall(r'href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"', doc)
for a in links:
  print a

Sommario

Questo è tutto il contenuto dell'articolo, spero che il contenuto di questo articolo possa aiutare la tua apprendimento o lavoro, se hai domande puoi lasciare un messaggio di discussione.

教程基础

Tutorial di base HTML
Tutorial di base HTML5
Manuale di riferimento HTML
Tutorial SVG
Tutorial CSS
Manuale di riferimento CSS
Tutorial CSS3
Tutorial Bootstrap3
Tutorial Bootstrap4
Icone Font Awesome
Tutorial JavaScript
Manuale di riferimento JavaScript
Tutorial jQuery
Tutorial AJAX
Tutorial JSON
Tutorial AngularJS
Tutorial ReactJS
Tutorial NodeJS
Tutorial Python
Tutorial C++
Tutorial Golang
Tutorial C
Tutorial PHP
Tutorial C#
Tutorial LINQ
Tutorial Lua
Tutorial Ruby
Tutorial Rust
Tutorial Linux
Tutorial R
Tutorial Docker
Scala教程
MatLab教程
Erlang教程
Pandas教程
Numpy教程
Matplotlib教程
Flask教程
Java教程
SpringBoot教程
JDBC教程
JSP教程
Servlet教程
Maven教程
Spring教程
Django教程
Swift教程
Kotlin教程
SQL教程
MongoDB教程
SQLite教程
PostgreSQL教程
MySql教程
Redis教程
Elasticsearch教程