Python 是一种高级编程语言,越来越受到广泛的关注和使用。它的一个特点是有很多强大的工具和库,可以方便开发各种应用程序。在本文中,我们将使用 Python 来爬取网页上的职位信息。
import requests from bs4 import BeautifulSoup # 网页地址 url = "https://www.zhipin.com/c101280600/?query=python" # 请求网页 response = requests.get(url) # 解析网页内容 soup = BeautifulSoup(response.text, 'html.parser') # 获取职位信息列表 jobs = soup.find_all('div', {'class': 'job-list'}) # 循环遍历职位信息 for job in jobs: # 获取公司名称和职位名称 company = job.find('div', {'class': 'company-text'}).find('h4').find('a').string position = job.find('div', {'class': 'job-title'}).find('span').string # 获取薪资和工作地点 salary = job.find('span', {'class': 'red'}).string address = job.find('span', {'class': 'job-pub-time'}).string # 打印职位信息 print('公司:', company) print('职位:', position) print('薪资:', salary) print('工作地点:', address)
以上代码通过使用 requests 库发起 HTTP 请求,并使用 BeautifulSoup 库解析 HTML 内容。通过分析网页内容,我们找到了符合要求的职位信息列表,并逐一获取了公司名称、职位名称、薪资和工作地点。最后,我们将获取到的职位信息输出到控制台。
通过 Python 爬虫,我们可以方便地获取互联网上的各种信息。在职业搜索和招聘上,使用 Python 爬虫也逐渐成为了一种重要的手段。