Adatbányászat: Instagram lehúzó (1)

A közösségi média generációja folyamatosan változik. Akkoriban az emberek többsége a Facebookon keresztül osztotta meg gondolatait és képeit, és a Facebook volt az a hely, ahol az emberek online kommunikáltak a barátaival. De mint életünk, semmi sem tart örökké. Egy ponton könnyen láthatjuk, hogy a közösségi média népszerűsége a Facebookon keresztül Instagramra költözött. Az idő múlásával már nem sokan teszik közzé ötleteiket, képeket a Facebook-on. Ennek a változásnak a lehetséges okai lehetnek a régi platform, az új tartalom iránti vágy vagy az új közösségi médiumok sajátosságai. Különböző okok befolyásolják. Lehet, hogy kissé késő lenne megvitatni arról, hogy miért költöztek az emberek Instagramba a Facebookon, mert már régen azóta az emberek elkezdték használni a Instagramot, és még mindig valami másra, például a snapchatre vagy valami másra költöztek. Személy szerint azt hiszem, hogy az a tény, hogy soha nem változnak azok a szavak / képek, amelyeket a felhasználók a közösségi médiában tesznek közzé, sok információt tartalmaznak az emberekről, a társadalomról, a trendekről és a társadalmi tendenciáról, így az emberek szándékát a közösségi médián keresztül tudjuk értelmezni, függetlenül attól, hogy mi a szociális média. Így a közösségi média elemzése segít megérteni, milyen tendenciát követnek az emberek jelenleg. A legszembetűnőbb ok arra késztette, hogy az Instagram-ra összpontosítsam, hogy a fényképre specializálódott. Nem olyan, mint a Facebook vagy a Tweeter, az Instagram a Fotóra koncentrál. Elsősorban a Képek alapján egyfajta társadalmi jelenséget hoz létre. Az Instagram inkább arra készteti az embereket, hogy képeikkel fényképeket közvetítsenek, nem pedig közvetlenül felfedik őket. A közösségi média érdekes része. Akkoriban a közösségi média felhasználó el akarta mondani, mi van, mit gondol a szavakon és a képeken, de manapság máris szándékukra utalnak, és azt akarják, hogy az emberek hallgassák meg ezt hallgatólagosan vagy titokban. Ezen kívánságok szerint a közösségi média képei az Instagram-on mások felé mutatnak. Ez a különös vágy sikeresen rávetette az embereket az Instagramra. Ezen a ponton szeretnék megosztani valamit, amelyet Instagram-Scraper-nek hívnak, azok számára, akik tanulni szeretnének az Instagramról.

Az Instagram-Scraper egy olyan eszköz, amely lehetővé teszi a legtöbb Instagram-on közzétett információ beszerzését, beleértve a fényképeket, feliratokat és megjegyzéseket.

További információkért mindig megnézheti a hivatalos weboldalt: https://github.com/rarcega/instagram-scraper

Az Instagram Scraper telepítése elég egyszerű. Ha Linux rendszeren van, akkor könnyen gépelhet, ez továbbra is működik a Mac OS-ben, ha már telepítette a pip-et.

pip install instagram-lehúzó

A telepítés elvégzése után egyszerűen gépelhet

instagram-kaparó -h

az instagram-lehúzó összes funkciójának megtekintéséhez.

felhasználás: instagram-lehúzó [-h] [- rendeltetési cél DESTINATION]
[--login_user LOGIN_USER] [--login_pass LOGIN_PASS]
[--login_only] [- fájlnév: FILENAME] [--quiet]
[--maximum MAXIMUM] [--tartó_felhasználói név]
[--media_metadata] [--include-location]
[--media_types MEDIA_TYPES [MEDIA_TYPES ...]]
[- legújabb] [--tag] [--hely] [--keresési hely]
[- kommentárok] [- verbose VERBOSE]
[felhasználónév [felhasználónév ...]]
az instagram-scraper lekaparja és letölt egy instagram felhasználói fényképeket és videókat.
helyzetbeli érvek:
felhasználónév Instagram felhasználó (k) a kaparáshoz
választható érvek:
-h, --segítsd megmutatni ezt a súgót és kilépni
- rendeltetési cél, - d cél
Töltse le a rendeltetési helyet
--login_user LOGIN_USER, -u LOGIN_USER
Instagram bejelentkezési felhasználó
--login_pass LOGIN_PASS, -p LOGIN_PASS
Instagram bejelentkezési jelszó
--login_only, -l Anonim tartalék letiltása, ha a bejelentkezés sikertelen
- FILENAME fájlnév, -F FILENAME
Út egy fájlhoz, amely tartalmazza a lekaparandó felhasználók listáját
- csendes, -q légy csendes a kaparás közben
--maximum MAXIMUM, -m MAXIMUM
A lekaparandó elemek maximális száma
--tartó felhasználónév, -n
Létrehozza a felhasználónév alkönyvtárat, ha a rendeltetési hely jelzője van
készlet
--media_metadata Média metaadatainak mentése a json fájlba
--include-location Tartalmazza az adatokat a média metaadatainak mentésekor
--media_types MEDIA_TYPES [MEDIA_TYPES ...], -t MEDIA_TYPES [MEDIA_TYPES ...]
Adja meg a lehúzandó hordozó típusát
- legutolsó új média kaparása az utolsó kaparás óta
--tag A média lekaparása hashtag segítségével
--helyzet A média lekaparása helyazonosítóval
--search-location Keressen helyeket név szerint
--comments A hozzászólás mentése a json fájlba
- verbose VERBOSE, -v VERBOSE
Naplózási részletességi szint
Elrejtheti hitelesítő adatait az előzmények ellen, ha elolvassa a
felhasználónév egy helyi fájlból:
$ instagram-scraper @ insta_args.txt user_to_scrape
az insta_args.txt fájl így néz ki:
-u = my_username
-p = my_password

Ez a kaparó számos módon hatékonyan működik. Ha egy adott funkcióra keres, akkor jobb, ha a hivatalos webhelyet találja.

De ha az adatok bányásztatásán gondolkodik, akkor jobb lenne, ha van egy szkript a futtatásához, mert az instagram-scraper egyszerre egy lekérdezést nyújt. Annak ellenére, hogy biztosítják azt a funkciót, hogy számos felhasználói fényképet kapjanak egy parancs funkcióval, érdemes lehet eltérő lehetőségeket. Tehát azt javaslom, hogy nagy adatokat szerezzek az Instagramból, a Python használatával, hogy hozzon létre egy szkriptet több lekérdezés elküldésére.

Íme egy egyszerű példa arra a szkriptre, amely a Python által üzemeltetett helyek „unmami burger” nevű helyét tartalmazza

import alfolyamat importálási ideje
location = 'umami burger', míg igaz: p = subprocess.Popen (["instagram-scraper", "--search-location", location], stdout = subprocess.PIPE) output, err = p.communicate (), ha output ! = "": nyomtatási kimeneti idő. alvás (20)

Ez egy szkript az Instagram adatbázisban tárolt hely keresésére. Megfelelőnek kell lennie a Instagram webhelyén található keresőmotornak. Bármikor nyugodtan szerkesztheti ezt az egyszerű szkriptet, hogy megkapja a kívánt adatokat. De az a dolog, amelyet meg kell győződnie arról, hogy minden lekérdezés között alszik. Ha szünetek nélkül továbbítja a lekérdezéseket, az Instagram egy ideig letiltja az Ön IP-jét. Nincs határozott ideje annak a határidőnek, amellyel maximalizálhatjuk a lekérdezések számát, hacsak az Instagram ezt hivatalosan nem biztosítja. Tehát érdemes kipróbálni, hogy mennyi alvási időt kellene adnia. Ez képek, megjegyzések és kimenetek száma szerint változhat keresés után.

Helycímkék az Instagram webhelyen

Instagram kaparó kimenet:

hely-azonosító: 62304541, cím: Umami Burger, felirat: 432 6th Ave, város:, lat: 40,7344, lng: -73,99991
Hely-azonosító: 292698230, cím: Umami Burger, felirat: 225 Liberty St, Ste 247, város:, lat: 40.71156, lng: -74.01533
location-id: 19002234, cím: Umami Burger, felirat: 338 S Anaheim Blvd, Anaheim, California, város: Anaheim, California, lat: 33.8324803, lng: -117.9126456
location-id: 11265111, cím: Umami Burger, felirat: 2981 Bristol St, Ste B2, Costa Mesa, CA, város: Costa Mesa, CA, lat: 33.67915, lng: -117.88604
Helyszín azonosítója: 87627717, cím: Umami Burger, felirat: 1200 Franklin St, Ste 2190, város:, lat: 37.8025053, lng: -122.2706073

Ha arra törekszik, hogy az „Umami Burger” -től Anaheimben (Kalifornia) található adatokat, egyszerűen elküldje a lekérdezést a hely-azonosítóval. Túl sok ember azonban megjelölte ezt a helyet képeivel, korlátozni fogom a letöltött képek számát 300-ra, és megkapom egy meta-adatfájlt is. A metaadatfájl .json formátumú lesz, amely feliratot tartalmaz, a LIKES számát, a fénykép legtöbb adatát.

instagram-lehúzó - elhelyezkedés 19002234 -m 300 --media_metadata

Kimenet:

Még azt is gondoltam, hogy korlátozom a képek számát, de csak 274 képe van, ami azt jelenti, hogy 274 kép található, amelyeket az Instagram felhasználók Umami Burger címkével láttak el, Kaliforniában, Anaheim, Kalifornia. A mappájában egy csomó kép és .json fájl látható.

Az Instagram-lehúzó a hatalmas eszköz az adatok gyűjtéséhez az Instagram-ból. Csak azt osztottam meg, hogyan lehet keresni a helyek címkéjén, de sokkal több adatot szerezhet vele.

Remélem, hogy ez segít, és megosztom néhány együttműködést az Instagram Scraperrel és a Yelp-szel!