Back to Question Center
0

סעמאַלט: די מערסט נוציק וועבזייטל סקרייפּינג מכשירים צו עקסטראַקט אָנליין דאַטאַ

1 answers:

כל וועב סקרייפּינג געצייַג s זענען דעוועלאָפּעד צו עקסטראַקט אינפֿאָרמאַציע פון ​​די יגזיסטינג וועב זייַטלעך. זיי זענען נוציק פֿאַר אַלעמען טריינג צו זאַמלען די נייטיק דאַטן פון די וועלט ברייט וועב. די סאָפטווער קוקט פֿאַר נייַ דאַטע אויטאָמאַטיש אָדער מאַניואַלי, פעטשינג די נייַ אָדער יגזיסטינג דאַטן און סטאָרינג עס פֿאַר דיין צוטריט. פֿאַר בייַשפּיל, עטלעכע וועב סקרייפּינג מגילה זענען מענט צו זאַמלען אינפֿאָרמאַציע וועגן פּראָדוקטן פון עבייַ און אַמאַזאָן. זיי העלפן האַלטן אונדז אַבזאָרבד פון וואָס איז געגאנגען אויף אין די מאַרק. פאָרלייגן אַ פּראָדוקט שטיצן בעטן די בעסטער וועב סקרייפּינג מכשירים:

לאָזן אונדז אַ קוק בייַ די רשימה פון די בעסטער וועב סקרייפּינג מכשירים אויף די אינטערנעט:

Dexi.io: ​​

( 11) Dexi.io שטיצט די דאַטן זאַמלונג פון אַ פּלאַץ פון זייטלעך און ריקווייערז קיין אראפקאפיע. עס מיטל איר נאָר דאַרפֿן צו עפענען זייַן באַאַמטער וועבזייַטל און באַקומען סטאַרטעד מיט דיין דאַטע יקסטראַקשאַן. דעם געצייַג קומט מיט אַ בלעטערער-באזירט רעדאַקטאָר, און די דאַטן קענען זיין געזונט אויף Google Drive and Box.net.

סקראַפּינגהוב:

סקראַפּינגהוב איז אַ שטאַרק וואָלקן-באזירט דאַטע יקסטראַקשאַן פּראָגראַם וואָס העלפט דעוועלאָפּערס און פּראָוגראַמערז ברענגען די ווערטפול דאַטן. דעם פּראָגראַם ניצט אַ קליינטשיק פראקסי ראָטאַטאָר גערופן קראַוולעראַ, וואָס העלפט קראָל אַ ריזיק נומער פון באָט-פּראָטעקטעד וועבסיטעס..

ParseHub:

ParseHub איז דעוועלאָפּעד צו קריכן איין און קייפל זייטלעך מיט אָדער אָן קיין שטיצן פון AJAX, דזשאַוואַסקריפּט, קיכלעך, redirects, און סעסיע. דעם געצייַג איז בנימצא אין דער וועב אַפּ פאָרעם און ווי די פֿרייַ דעסקטאַפּ אַפּ פֿאַר מעק אַס רענטגענ, פֿענצטער, און לינוקס.

וויסואַלסקראַפּער:

וויסואַלסקראַפּער איז מענט צו סקראַטש דאַטן אין די פאָרעם פון טעקסט און בילדער; דעם פּראָגראַם קענען זיין געניצט צו זאַמלען אינפֿאָרמאַציע פון ​​ביידע יקערדיק און אַוואַנסירטע וועב זייַטלעך. איר קענען לייכט קלייַבן, פירן און אָרגאַניזירן דיין וועב דאַטע מיט זייַן באַניצער-פרייַנדלעך צובינד.

Spinn3r:

Spinn3r העלפט אינדעקס צופרידן ענלעך צו אַז פון Google און סאַוועס דיין יקסטראַקטאַד דאַטן אין די JSON טעקעס. דעם וועב סקרייפּער וועט קעסיידער יבערקוקן דיין זייטלעך און געפֿינען דערהייַנטיקונגען פון פאַרשידענע מקורים צו באַקומען פאַקטיש-צייַט פּיימאַנץ פֿאַר איר.

80 לעגס:

80 לעגס איז אַ נוציק, שטאַרק און פלעקסאַבאַל וועב קראַוולער און דאַטן עקסטראַקטאָר. איר קענען קאַנפיגיער דעם פּראָגראַם ווי פּער דיין באדערפענישן ווי עס ריטשט די גוואַלדיק סומע פון ​​דאַטן טייקעף.

סקראַפּער:

סקראַפּער איז אַ באַרימט קראָום געשפּרייט מיט פילע פֿעיִקייטן. דערצו, עס איז גוט פֿאַר עקספּאָרטינג די דאַטן צו Google דרייוו און איז נוצלעך פֿאַר ביידע ניט-פּראָוגראַמערז און פּראָוגראַמערז. דעם פּאָטער געצייַג וועט אויטאָמאַטיש דזשענערייט קליין XPaths פֿאַר דיין URL ס.

אָוטוויט הוב:

אָוטוויט הוב איז אַן אָסאַם פירעפאָקס פאַרלענגערונג מיט גורל פון דאַטן יקסטראַקשאַן טשאַראַקטעריסטיקס. עס העלפט פאַרפּאָשעטערן אונדזער וועב זוכן און קענען בלעטער דורך די וועב זייַטלעך אויטאָמאַטיש, סטאָרינג אַ גרויס סומע פון ​​דאַטן יעדער שעה.

ימפּאָרט.יאָ:

ימפּאָרט.יאָ אָפפערס צו פאָרעם די ספּעציפיש דאַטאַסיז דורך ימפּאָרטינג די אינפֿאָרמאַציע פון ​​באַזונדער וועב זייַטלעך און אַרויספירן עס צו די קסוו טעקעס. דעם פּראָגראַם ניצט קאַטינג-ברעג טעכנאָלאָגיע און ברענגען מיליאַנז פון דאַטע אויף אַ טעגלעך יקער.

1 week ago
סעמאַלט: די מערסט נוציק וועבזייטל סקרייפּינג מכשירים צו עקסטראַקט אָנליין דאַטאַ
Reply