練習 5.1: 修改findlinks代碼中遍歷n.FirstChild鏈表的部分,將迴圈調用visit,改成遞歸調用。 練習 5.2: 編寫函數,記錄在HTML樹中出現的同名元素的次數。 練習 5.3: 編寫函數輸出所有text結點的內容。註意不要訪問<script>和<style>元素,因為這些 ...
練習 5.1: 修改findlinks代碼中遍歷n.FirstChild鏈表的部分,將迴圈調用visit,改成遞歸調用。
練習 5.2: 編寫函數,記錄在HTML樹中出現的同名元素的次數。
練習 5.3: 編寫函數輸出所有text結點的內容。註意不要訪問<script>和<style>元素,因為這些元素對瀏覽者是不可見的。
練習 5.4: 擴展visit函數,使其能夠處理其他類型的結點,如images、scripts和style sheets。
// Findlinks1 prints the links in an HTML document read from standard input. package main import ( "fmt" "os" "golang.org/x/net/html" ) func main() { doc, err := html.Parse(os.Stdin) if err != nil { fmt.Fprintf(os.Stderr, "findlinks1: %v\n", err) os.Exit(1) } for _, link := range visit(nil, doc) { fmt.Println(link) } var res = make(map[string]int) res = count(res, doc) for k, v := range res { fmt.Printf("%s==>%d \n", k, v) } //fmt.Println(res) for _, text := range visit3(nil, doc) { fmt.Println(text) } for _, link := range visit4(nil, doc) { fmt.Println(link) } } // visit appends to links each link found in n and returns the result. func visit(links []string, n *html.Node) []string { if n.Type == html.ElementNode && n.Data == "a" { for _, a := range n.Attr { if a.Key == "href" { links = append(links, a.Val) } } } /* 練習 5.1: 修改findlinks代碼中遍歷n.FirstChild鏈表的部分,將迴圈調用visit,改成遞歸調用。 實在是不知道為啥不對,我選擇放棄 if n.FirstChild!=nil{ links=visit(links,n.FirstChild) }else if n.NextSibling!=nil{ //n=n.NextSibling links=visit(links,n.NextSibling) } */ for c := n.FirstChild; c != nil; c = c.NextSibling { links = visit(links, c) } return links } /* 練習 5.2: 編寫函數,記錄在HTML樹中出現的同名元素的次數。 */ func count(res map[string]int, n *html.Node) map[string]int { if n.Type == html.ElementNode { res[n.Data]++ } for c := n.FirstChild; c != nil; c = c.NextSibling { res = count(res, c) } return res } /* 練習 5.3: 編寫函數輸出所有text結點的內容。註意不要訪問<script>和<style>元素,因為這些元素對瀏覽者是不可見的。 */ func visit3(texts []string, n *html.Node) []string { if n.Type == html.TextNode { texts = append(texts, n.Data) } for c := n.FirstChild; c != nil; c = c.NextSibling { if c.Data == "script" || c.Data == "style" { continue } texts = visit3(texts, c) } return texts } /* 練習 5.4: 擴展visit函數,使其能夠處理其他類型的結點,如images、scripts和style sheets。 */ func visit4(links []string, n *html.Node) []string { if n.Type == html.ElementNode && (n.Data == "a" || n.Data == "img" || n.Data == "link" || n.Data == "scripts") { for _, a := range n.Attr { if a.Key == "href" { links = append(links, a.Val) } } } for c := n.FirstChild; c != nil; c = c.NextSibling { links = visit4(links, c) } return links }