国产 无码 综合区,色欲AV无码国产永久播放,无码天堂亚洲国产AV,国产日韩欧美女同一区二区

php如何爬取天貓和淘寶商品數(shù)據(jù)

這篇具有很好參考價值的文章主要介紹了php如何爬取天貓和淘寶商品數(shù)據(jù)。希望對大家有所幫助。如果存在錯誤或未考慮完全的地方,請大家不吝賜教,您也可以點擊"舉報違法"按鈕提交疑問。

這篇文章主要介紹了php如何爬取天貓和淘寶商品數(shù)據(jù),具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

一、思路

最近做了一個網(wǎng)站用到了從網(wǎng)址爬取天貓和淘寶的商品信息,首先看了下手機端的網(wǎng)頁發(fā)現(xiàn)用的react,不太了解沒法搞,所以就考慮從PC入口爬取數(shù)據(jù),但是當(dāng)爬取URL獲取數(shù)據(jù)時并沒有獲取價格,庫存等的信息,仔細(xì)研究了下發(fā)現(xiàn)是異步請求了另一個接口,但是接口要使用refer才能獲取數(shù)據(jù),于是就通過以下方式寫了一個簡單的爬蟲,用于爬取商品預(yù)覽圖和商品的第一個分類的價格、庫存等。

二、實現(xiàn)

代碼如下:

function?crawlUrl($url){
import('PhpQuery.Curl');
?$curl=new?\Curl();
?$result?=?$curl->read($url);
?$content?=?mb_convert_encoding(?$result['content'],?'UTF-8',?'UTF-8,GBK,GB2312,BIG5'?);
?$myres=array();
?if(strrpos($url,'taobao.com')!=false)?{
??//匹配是否下架
??if(strpos($content,'此寶貝已下架')!==false){
???return?false;
??}
??preg_match("|itemId???:?'(.*)'|isU",?$content,?$match);
??$item_id=$match[1];
??preg_match("|sellerId???:?'(.*)'|isU",?$content,?$match);
??$sellet_id=$match[1];
??preg_match("|<title>(.*)</title>|isU",$content,$match);
??$title=$match[1];
??//價格庫存信息
??$ch?=?curl_init();
??curl_setopt?($ch,?CURLOPT_URL,?'/tupian/20230522/sib.htm
??$opt[CURLOPT_HEADER]=false;
??$opt[CURLOPT_CONNECTTIMEOUT]=15;
??$opt[CURLOPT_TIMEOUT]=300;
??$opt[CURLOPT_AUTOREFERER]=true;
??$opt[CURLOPT_USERAGENT]='Mozilla/5.0?(Windows?NT?6.1)?AppleWebKit/536.11?(KHTML,?like?Gecko)?Chrome/20.0.1132.47?Safari/536.11';
??curl_setopt_array($ch,$opt);
??curl_setopt?($ch,?CURLOPT_RETURNTRANSFER,?1);
??curl_setopt?($ch,CURLOPT_REFERER,$url);
??curl_setopt($ch,?CURLOPT_SSL_VERIFYPEER,?false);
??$out_put=curl_exec?($ch);
??curl_close?($ch);
??$res=str_replace('onSibRequestSuccess(',"",$out_put);
??$res=rtrim($res,');1');
??$result=json_decode($res,true);
??//查詢出圖片信息
??preg_match('|<ul?id="J_UlThumb"?class="tb-thumb?tb-clearfix">(.*)</ul>|isU',?$content,?$match);
??preg_match_all('/<img?data-src="(.*?)"?\//',?$match[1],?$images);

??$myres['title']=str_replace('-淘寶網(wǎng)','',$title);

??$myres['price']=current($result['data']['originalPrice']);

??$myres['act_price']=current($result['data']['promotion']['promoData']);

??$myres['stock']=$result['data']['dynStock']['stock'];

??$myres['banners']=$images[1];
?}else{
??//匹配是否下架
??if(strpos($content,'此寶貝已下架')!==false){
???return?false;
??}
??$start=strpos($url,'&id=');
??$item_id=substr($url,$start+4,12);
??if(!is_numeric($item_id)){
???$start=strpos($url,'?id=');
???$end=strpos($url,'&spm');
???$item_id=substr($url,$start+4,$end-$start-4);
??}
??preg_match("|<title>(.*)</title>|isU",$content,$match);
??$title=$match[1];
??$myurl='/tupian/20230522/initItemDetail.htm
??//價格庫存信息
??$ch?=?curl_init();
??curl_setopt?($ch,?CURLOPT_URL,?$myurl);
??$opt[CURLOPT_HEADER]=false;
??$opt[CURLOPT_CONNECTTIMEOUT]=15;
??$opt[CURLOPT_TIMEOUT]=300;
??$opt[CURLOPT_AUTOREFERER]=true;
??$opt[CURLOPT_USERAGENT]='Mozilla/5.0?(Windows?NT?6.1)?AppleWebKit/536.11?(KHTML,?like?Gecko)?Chrome/20.0.1132.47?Safari/536.11';
??curl_setopt_array($ch,$opt);
??curl_setopt?($ch,?CURLOPT_RETURNTRANSFER,?1);
??curl_setopt?($ch,CURLOPT_REFERER,$url);
??curl_setopt($ch,?CURLOPT_SSL_VERIFYPEER,?false);
??$out_put=curl_exec?($ch);
??curl_close?($ch);
??$res?=?mb_convert_encoding(?$out_put,?'UTF-8',?'UTF-8,GBK,GB2312,BIG5'?);
??$res=str_replace('setMdskip',"",$res);
??$res=str_replace('(',"",$res);
??$res=str_replace(')',"",$res);
??$result=json_decode($res,true);
??$nowk="";
??$nowstore="";
??foreach($result['defaultModel']['inventoryDO']['skuQuantity']?as?$k=>$val){
???$nowk=$k;
???$nowstore=$val;
???break;
??}

??$myres['title']=str_replace('-tmall.com天貓','',$title);

??$myres['price']=$result['defaultModel']['itemPriceResultDO']['priceInfo'][$nowk]['price'];

??$myres['act_price']=isset($result['defaultModel']['itemPriceResultDO']['priceInfo'][$nowk]['suggestivePromotionList'])?$result['defaultModel']['itemPriceResultDO']['priceInfo'][$nowk]['suggestivePromotionList']:$result['defaultModel']['itemPriceResultDO']['priceInfo'][$nowk];

??$myres['stock']=$result['defaultModel']['inventoryDO']['totalQuantity']?$result['defaultModel']['inventoryDO']['totalQuantity']:$nowstore['quantity'];
??//查詢出圖片信息
??preg_match('|<ul?id="J_UlThumb"?class="tb-thumb?tm-clear">(.*)</ul>|isU',$content,?$match);
??preg_match_all('/<img?src="(.*?)"?\//',$match[1],$images);
??$myres['banners']=$images[1];
?}
?return?$myres;
}

上述代碼用到phpquery的庫,但是其實沒啥用,直接用Curl就行,具體爬取的數(shù)據(jù)可以穿參查看結(jié)果,方法不區(qū)分淘寶和天貓鏈接,但是前提是必須是PC端鏈接,另外正則寫的不規(guī)范,所以可以自己重寫正則來匹配數(shù)據(jù)。

封裝后的接口名稱:item_get?

響應(yīng)字段表-試用API數(shù)據(jù)

名稱 類型 必須 示例值 描述

item

item[] 1 寶貝詳情數(shù)據(jù)

num_iid

Bigint 1 520813250866 寶貝ID

title

String 1 三刃木折疊刀過安檢創(chuàng)意迷你鑰匙扣鑰匙刀軍刀隨身多功能小刀包郵 寶貝標(biāo)題

desc_short

String 0 商品簡介

promotion_price

Int 0 優(yōu)惠價

price

Float 1 25.8 價格

total_price

Float 0 0

suggestive_price

Float 0 0

orginal_price

String 0 25.80 原價

nick

String 0 歡樂購客棧 掌柜昵稱

num

Int 0 3836 庫存

min_num

Int 0 0 最小購買數(shù)

detail_url

String 0 http://item.taobao.com/item.htm?id=520813250866 寶貝鏈接

pic_url

String 1 //gd2.alicdn.com/imgextra/i4/2596264565/TB2p30elFXXXXXQXpXXXXXXXXXX_!!2596264565.jpg 寶貝圖片

brand

String 0 三刃木 品牌名稱

brandId

Int 0 8879363 品牌ID

rootCatId

Int 0 50013886 頂級分類ID

cid

Int 1 50014822

crumbs

Mix 0 [] 導(dǎo)航菜單

created_time

String 0

modified_time

String 0

delist_time

String 0

desc

String 0 商品詳情

desc_img

Mix 0 [] 商品詳情圖片

item_imgs

Mix 0 item_imgs[] 商品圖片

item_weight

String 0

item_size

String 0

location

String 0 發(fā)貨地

express_fee

Float 0 0.00 快遞費用

ems_fee

Float 0 EMS費用

post_fee

Float 0 物流費用

shipping_to

String 0 發(fā)貨至

has_discount

Boolean 0 false 是否有優(yōu)惠

video

video[] 0 商品視頻

is_virtual

String 0

is_promotion

Boolean 0 false 是否促銷

props_name

String 0 1627207:1347647754:顏色分類:長方形帶開瓶器+送工具刀卡+鏈子;1627207:1347647753:顏色分類:橢圓形帶開瓶器+送工具刀卡+鏈子; 商品屬性名。格式為pid1:vid1:name1:value1;pid1:vid2:name2:value2。

prop_imgs

prop_imgs[] 0 商品屬性圖片列表

property_alias

String 0 20509:9974422:36;1627207:28326:紅色;20509:9975710:38;1627207:28326:紅色;20509:9981357:40;1627207:28326:紅色 銷售屬性值別名。格式為pid1:vid1:alias1;pid1:vid2:alia2。

props

Mix 0 [{ "name": "產(chǎn)地","value": "中國" }] 商品屬性

total_sold

Int 0

skus

skus[] 0 商品規(guī)格信息列表

seller_id

Int 0 2844096782 賣家ID

sales

Int 0 138 銷量

shop_id

Int 0 151372205 店鋪ID

props_list

Mix 0 {20509:9974422: 尺碼:36} 商品屬性

seller_info

seller_info[] 1 賣家信息

tmall

Boolean 0 false 是否天貓

error

String 0 錯誤信息

warning

String 0 警告信息

url_log

Mix 0 []

favcount

Int 0 0

fanscount

Int 0 0

method

String 0 item_tmall:pget_item

promo_type

String 0

props_img

Mix 0 1627207:28326": "http://img.alicdn.com/imgextra/i2/2844096782/O1CN01VrjpXt1zyCc9DvERE_!!2844096782.jpg 屬性圖片

shop_item

Mix 0 []

relate_items文章來源地址http://www.zghlxwxcb.cn/news/detail-636118.html

Mix 0 []

到了這里,關(guān)于php如何爬取天貓和淘寶商品數(shù)據(jù)的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!

本文來自互聯(lián)網(wǎng)用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務(wù),不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。如若轉(zhuǎn)載,請注明出處: 如若內(nèi)容造成侵權(quán)/違法違規(guī)/事實不符,請點擊違法舉報進(jìn)行投訴反饋,一經(jīng)查實,立即刪除!

領(lǐng)支付寶紅包贊助服務(wù)器費用

相關(guān)文章

  • PHP 如何設(shè)計一個高安全的電商平臺:淘寶/京東商品類API封裝接口

    PHP 如何設(shè)計一個高安全的電商平臺:淘寶/京東商品類API封裝接口

    如何保證API接口安全 接口的安全性主要圍繞Token、Timestamp和Sign三個機制展開設(shè)計,保證接口的數(shù)據(jù)不會被篡改和重復(fù)調(diào)用,下面具體來看: Token授權(quán)機制 :用戶使用用戶名密碼登錄后服務(wù)器給客戶端返回一個Token(通常是UUID),并將Token-UserId以鍵值對的形式存放在緩存服務(wù)

    2024年02月09日
    瀏覽(26)
  • 淘寶/天貓商品API:實時數(shù)據(jù)獲取與安全隱私保護(hù)的指南

    隨著電子商務(wù)的快速發(fā)展,淘寶/天貓等電商平臺已成為商家和消費者的重要交易場所。對于電商企業(yè)而言,實時掌握店鋪商品的銷售情況、庫存狀態(tài)等信息至關(guān)重要。然而,手動管理和更新商品信息既費時又費力。因此,淘寶/天貓?zhí)峁┑纳唐稟PI成為商家實時獲取商品數(shù)據(jù)的

    2024年02月04日
    瀏覽(22)
  • 淘寶-天貓商品API:實時數(shù)據(jù)獲取與安全隱私保護(hù)的指南

    淘寶-天貓商品API:實時數(shù)據(jù)獲取與安全隱私保護(hù)的指南

    隨著電子商務(wù)的快速發(fā)展,淘寶/天貓等電商平臺已成為商家和消費者的重要交易場所。對于電商企業(yè)而言,實時掌握店鋪商品的銷售情況、庫存狀態(tài)等信息至關(guān)重要。然而,手動管理和更新商品信息既費時又費力。因此,淘寶/天貓?zhí)峁┑纳唐稟PI成為商家實時獲取商品數(shù)據(jù)的

    2024年04月24日
    瀏覽(20)
  • 從API到界面:如何將淘寶/天貓商品詳情返回值轉(zhuǎn)化為用戶友好的展示

    在當(dāng)今數(shù)字化時代,API(應(yīng)用程序編程接口)已經(jīng)成為連接不同服務(wù)和數(shù)據(jù)的橋梁。對于電商平臺來說,API更是不可或缺的一部分。本文將以淘寶/天貓為例,探討如何將API返回的商品詳情數(shù)據(jù)轉(zhuǎn)化為用戶友好的展示形式。我們將通過代碼示例來揭示這一過程。 1. API獲取商品

    2024年02月19日
    瀏覽(23)
  • 淘寶/天貓獲取商品銷量詳情 API 返回值說明

    淘寶/天貓獲取商品銷量詳情 API 返回值說明

    taobao.item_get_sales 公共參數(shù) 名稱 類型 必須 描述 key String 是 調(diào)用key(必須以GET方式拼接在URL中) secret String 是 調(diào)用密鑰 api_name String 是 API接口名稱(包括在請求地址中)[item_search,item_get,item_search_shop等] cache String 否 [yes,no]默認(rèn)yes,將調(diào)用緩存的數(shù)據(jù),速度比較快 result_type St

    2024年02月09日
    瀏覽(33)
  • 淘寶/天貓獲取賣出的商品訂單列表 API(taobao.seller_order_list)

    淘寶和天貓平臺提供了一個API接口(taobao.seller_order_list),用于獲取賣家出售的商品訂單列表。以下是使用該API的基本步驟: 獲取API密鑰:首先,您需要在淘寶開放平臺(Open Platform)上注冊賬號并創(chuàng)建一個應(yīng)用,以獲取API密鑰。API密鑰是用于驗證您的身份和授權(quán)的憑證。 調(diào)

    2024年01月21日
    瀏覽(18)
  • Python爬取電商數(shù)據(jù):商品采集接口 商品詳情數(shù)據(jù)API 商品主圖接口

    Python爬取電商數(shù)據(jù):商品采集接口 商品詳情數(shù)據(jù)API 商品主圖接口

    學(xué)習(xí) Python 自動化的一個好辦法就是構(gòu)建一個價格追蹤器。由于這項任務(wù)生成的腳本可以立即投入使用,所以對于初學(xué)者來說尤為方便。本文將向大家介紹如何用 Python 采集器建立一個可立即實現(xiàn)電商價格監(jiān)控的可擴展價格追蹤器。 價格監(jiān)控的好處多多。對于您個人來說,通

    2023年04月24日
    瀏覽(23)
  • 淘寶Api接口開發(fā)系列,商品詳情數(shù)據(jù),搜索商品列表數(shù)據(jù),無貨源采集上貨模式,數(shù)據(jù)分析

    淘寶Api接口開發(fā)系列,商品詳情數(shù)據(jù),搜索商品列表數(shù)據(jù),無貨源采集上貨模式,數(shù)據(jù)分析

    淘寶API接口開發(fā)涉及多個方面,包括獲取商品詳情數(shù)據(jù)、搜索商品列表數(shù)據(jù)、無貨源采集上貨模式以及數(shù)據(jù)分析等。今天給大家介紹下通過封裝商品ID獲取淘寶商品詳情數(shù)據(jù)接口方法,支持高并發(fā)請求。下面我將分別對這些方面進(jìn)行簡要介紹。 1. 商品詳情數(shù)據(jù)接口 商品詳情數(shù)

    2024年04月16日
    瀏覽(27)
  • 探秘淘寶店鋪所有商品API接口:一鍵獲取海量數(shù)據(jù),引領(lǐng)電商數(shù)據(jù)革命

    探秘淘寶店鋪所有商品API接口:一鍵獲取海量數(shù)據(jù),引領(lǐng)電商數(shù)據(jù)革命

    一、概述 淘寶店鋪所有商品API接口是淘寶開放平臺提供的一套應(yīng)用程序接口,允許第三方開發(fā)者獲取淘寶店鋪中的所有商品信息。通過使用這個接口,開發(fā)者可以獲取到店鋪中所有商品的詳細(xì)信息,包括商品ID、標(biāo)題、描述、價格、庫存等,從而進(jìn)行深度分析和挖掘,進(jìn)一步

    2024年01月20日
    瀏覽(34)
  • 淘寶商品API使用示例:如何通過調(diào)用外部API來獲取淘寶商品價格銷量主圖詳情數(shù)據(jù)

    淘寶商品API使用示例:如何通過調(diào)用外部API來獲取淘寶商品價格銷量主圖詳情數(shù)據(jù)

    淘寶上的商品信息量非常之大,商品的詳情信息也很齊全。如何通過調(diào)用外部API來實現(xiàn)批量獲取商品價格銷量主圖詳情等信息呢?上周剛好完成了一個完整的淘寶商品采集項目,今天特來分享一下。 接口名稱:item_get 請求地址:https://api-test.cn/taobao/item_get result_type:[json,jso

    2024年02月10日
    瀏覽(30)

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

博客贊助

微信掃一掃打賞

請作者喝杯咖啡吧~博客贊助

支付寶掃一掃領(lǐng)取紅包,優(yōu)惠每天領(lǐng)

二維碼1

領(lǐng)取紅包

二維碼2

領(lǐng)紅包