HTML 解析
package main
import (
"github.com/PuerkitoBio/goquery"
"github.com/sohaha/zlsgo/zhttp"
"github.com/sohaha/zlsgo/zlog"
// "github.com/axgle/mahonia"
)
func main() {
var err error
var res *zhttp.Res
var doc *goquery.Document
res, err = zhttp.Get("https://blog.73zls.com/project")
if err != nil {
zlog.Fatal("请求失败", err.Error())
return
}
resbody := res.Body()
// 如果有编码问题则需要转码,如: GB18030, gbk 之类。
// resbody := mahonia.NewDecoder("gbk").NewReader(res.Body())
doc, err = goquery.NewDocumentFromReader(resbody)
if err != nil {
zlog.Fatal("解析失败", err)
}
project := doc.Find(".project-url").First()
if projectUrl, ok := project.Attr("href"); ok {
zlog.Debugf("项目:%s - %s", project.Text(), projectUrl)
return
}
zlog.Warn("没有找到 .project-url")
}
图片处理
其他
🥈
其他