C語言調用curl庫抓取網頁圖片

来源:http://www.cnblogs.com/shenlinken/archive/2016/07/18/5682432.html
-Advertisement-
Play Games

思路是先用curl抓取網頁源碼,然後以關鍵字尋找出圖片網址。 #include <stdio.h> #include <stdlib.h> #include <string.h> #include <curl/curl.h> void get_key_from_str(char *origin, c ...


思路是先用curl抓取網頁源碼,然後以關鍵字尋找出圖片網址。   #include <stdio.h> #include <stdlib.h> #include <string.h> #include <curl/curl.h>   void get_key_from_str(char *origin, char *str1, char *str2, char *key);   int main(int argc, char **argv) {     CURL *curl;     FILE *fp = NULL, *fp_read = NULL;     int file_size = 0;     char *tmp = NULL;     int flag = 0;     char key[1024] = {0};     char str1[128] = {0};     char str2[128] = {0};       if ((fp = fopen("test.txt", "w")) == NULL)     {         return 1;     }       curl = curl_easy_init();       if (curl)     {         flag = 1;         curl_easy_setopt(curl, CURLOPT_URL, argv[1]);     //curl設置網址         curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp);     //將網頁源碼存在文件中,好像只能存文件,不能存字元串           curl_easy_perform(curl);//開始抓取           curl_easy_cleanup(curl);           fclose(fp);           fp_read = fopen("test.txt", "rb");         fseek(fp_read, 0, SEEK_END);      //把指針移到文本最後         file_size = ftell(fp_read)     ;//算出文本大小         fseek(fp_read, 0, SEEK_SET);     //再把指針移到最前面         tmp = (char *)malloc(file_size * sizeof(char));     //malloc一段記憶體           printf("file_size:%d\n", file_size);             fread(tmp, file_size, sizeof(char), fp_read);     //讀取文件           fclose(fp_read);           snprintf(str1, sizeof(str1), "img src=\"");         snprintf(str2, sizeof(str2), "\"");           get_key_from_str(tmp, str1, str2, key);     //取得網址           printf("key:%s\n", key);         free(tmp);     }       if (!flag)     {         fclose(fp);     }       return 0; } //抓取str1和str2之間的關鍵字 void get_key_from_str(char *origin, char *str1, char *str2, char *key) {     char *p = strstr(origin, str1);     char *q = strstr(p + strlen(str1), str2);       int len = q - p - strlen(str1);       snprintf(key, len + 1, "%s", p + strlen(str1));     key[len + 1] = '\0'; }   gcc -g -Wall main.c -o test -lcurl   ./test url 即可
您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 現象:panel1和panel2或更多panel,疊放在一起,panel和panel2是同一層次的。panel1和panel2切換時只能顯示一個panel,如何切換呢? ...
  • 昨天看了一天的ajax,今天又看了兩個小時,終於弄出來個門道,其實ajax不是難,不是枯燥,而是自己不會用,這是根本所在 下麵分享學習經驗,以下是我程式代碼的下載地址:http://vdisk.weibo.com/s/BQ2aD 或者這個地址 http://download.csdn.net/det ...
  • 面向對象是一種開發思想,最應該記住的一句話是萬物皆對象。為了讓程式更好的被理解和編寫,把現實生活中描述事物的方式和思路融合進入,就成了面向對象的思想。把生活中的事物融合進程式中那麼就需要描述,描述分為特征和行為兩方面,而不同類別的對象特征和行為具有巨大的差異,為了更好的制定描述每一類事物的方式,那麼 ...
  • 在網上看到別人的代碼,寫下來留著看,歡迎各位指教,有沒有工廠模式的學習資料啊,留下給小弟學習學習. 首先寫個Model類,實現業務實體,我的比較簡單,只有三個欄位 View Code 1 public class LoginModel 2 { 3 #region 4 5 private int _A ...
  • 背水一戰 Windows 10 之 MVVM(Model-View-ViewModel): 通過 Binding 或 x:Bind 結合 Command 實現,通過非 ButtonBase 觸發命令 ...
  • .NET Core / ASP.NET Core 1 RTM發佈兩周後,社區也很積極,收到了非常多的反饋,上周五微軟的scott Hunter 在dotnet團隊官方博客上發佈了.NET Core全新的路線圖 https://blogs.msdn.microsoft.com/dotnet/2016/ ...
  • /// <summary> /// 把dataset數據轉換成json的格式 /// </summary> /// <param name="ds">dataset數據集</param> /// <returns>json格式的字元串</returns> public static string G ...
  • 一、概述 1.為什麼要用JDBC 資料庫是程式不可或缺的一部分,每一個網站和伺服器的建設都需要資料庫。對於大多數應用程式員(此處不包含資料庫開發人員)來說,我們更多的不是在DBMS中對資料庫進行操縱,而是在我們編寫的程式中對資料庫進行訪問,Java程式中一般都是通過JDBC來連接伺服器併進行增刪改查 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...