Back to Question Center
0

וועב סקרייפּינג: גוט און שלעכט באָץ - סעמאַלל דערקלערונג

1 answers:

באָץ פאָרשטעלן כּמעט 55 פּראָצענט פון אַלע וועב טראפיק. עס מיטל די מערסט פון דיין וועבזייַטל פאַרקער איז קומענדיק פון אינטערנעט באָץ גאַנץ ווי די מענטשן. א באָט איז די ווייכווארג אַפּלאַקיישאַן אַז איז פאַראַנטוואָרטלעך פֿאַר פליסנדיק אָטאַמייטיד טאַסקס אין די דיגיטאַל וועלט. די באָץ טיפּיקלי דורכפירן ריפּעטיטיוו טאַסקס בייַ הויך גיכקייַט און זענען מערסטנס אַנדיזייראַבאַל דורך מענטשן. זיי זענען פאַראַנטוואָרטלעך פֿאַר קליינשטעטלדיק דזשאָבס אַז מיר יוזשאַוואַלי נעמען פֿאַר גראַנטיד, אַרייַנגערעכנט זוכן מאָטאָר ינדאַקייטינג, וועבזייטל געזונט מאָניטאָרינג, מעסטן זייַן גיכקייַט, מאַכט אַפּס און פעטשינג די וועב צופרידן - drying soybeans in bin. באָץ זענען אויך געניצט צו אָטאַמייט די זיכערהייַט אַדאַטינג און יבערקוקן דיין זייטלעך צו געפינען וואַלנעראַביליטיז, רימידיאַטינג זיי טייקעף.

עקספּלאָרינג די חילוק צווישן גוט און שלעכט באָץ:

די באָץ קענען זיין צעטיילט אין צוויי פאַרשידענע קאַטעגאָריעס, גוט באָץ, און שלעכט באָץ. גוט באָץ באַזוכן דיין זייטלעך און העלפן זוכן ענדזשאַנז קראָל פאַרשידענע וועב זייַטלעך. פֿאַר בייַשפּיל, Googlebot קראָלז קרענק פון וועבסיטעס אין Google רעזולטאַטן און העלפט אַנטדעקן נייַ וועב זייַטלעך אויף די אינטערנעט. עס ניצט אַלגערידאַמז צו אָפּשאַצן וואָס בלאָגס אָדער וועבסיטעס זאָל זיין קראָלד, ווי אָפט קראָלינג זאָל זיין געטאן, און ווי פילע בלעטער זענען ינדאַקייטיד אַזוי ווייַט. שלעכט באָוץ זענען פאַראַנטוואָרטלעך פֿאַר פּערפאָרמינג מאַלישאַס טאַסקס, אַרייַנגערעכנט וועבזייַטל סקרייפּינג, קאָמענטאַר ספּאַם , און דדאָס אנפאלן. זיי פאָרשטעלן איבער 30 פּראָצענט פון אַלע פאַרקער אויף די אינטערנעט..די כאַקערז ויספירן די שלעכט באָץ און דורכפירן אַ פאַרשיידנקייַט פון בייזע טאַסקס. זיי יבערקוקן מיליאַנז צו ביליאַנז פון וועב זייַטלעך און ציל צו גאַנווענען אָדער סקראַפּ צופרידן יליגאַלי. זיי אויך פאַרנוצן די באַנדווידט און קאַנטיניואַסלי קוקן פֿאַר פּלוגינס און ווייכווארג וואָס קענען זיין געניצט צו דורכנעמען דיין וועבסיטעס און דאַטאַבייסיז.

וואָס איז דער שאָדן?

יוזשאַוואַלי, די זוכן ענדזשאַנז מיינונג די סקרייפּט צופרידן ווי די דופּליקאַט צופרידן. עס איז שעדלעך צו דיין זוכן מאָטאָר ראַנגקינגז און סקראַפּס וועט כאַפּן דיין רסס פידז צו צוטריט און רעפּובליק דיין צופרידן. זיי פאַרדינען אַ פּלאַץ פון געלט מיט דעם טעכניק. צום באַדויערן, די זוכן ענדזשאַנז האָבן נישט ימפּלאַמענאַד קיין וועג צו באַקומען באַפרייַען פון בייז באָץ. עס מיטל אויב דיין צופרידן איז קאַפּיד און פּייסטיד קעסיידער, דיין פּלאַץ ס ראַנגקינג געץ דאַמידזשד אין אַ ביסל וואָכן. די זוכן ענדזשאַנז טאָן פּינאַלייז די זייטלעך וואָס אַנטהאַלטן דופּליקאַט צופרידן, און זיי קענען נישט דערקענען וואָס וועבזייַטל ערשטער ארויס אַ שטיק פון אינהאַלט.

ניט אַלע וועב סקרייפּינג איז שלעכט

מיר מוזן אַרייַנלאָזן אַז סקרייפּינג איז ניט שטענדיק שעדלעך און בייזע. עס איז נוצלעך פֿאַר וועבזייטל אָונערז ווען איר ווילן צו פאַרשפּרייטן די דאַטן צו פילע מענטשן ווי מעגלעך. פֿאַר בייַשפּיל, די רעגירונג זייטלעך און אַרומפאָרן פּאָרטאַלס ​​צושטעלן נוצלעך דאַטן פֿאַר די אַלגעמיינע ציבור. דעם טיפּ פון דאַטע איז יוזשאַוואַלי בנימצא איבער די אַפּיס, און סקרייטערז זענען אנגעשטעלט צו זאַמלען דעם דאַטן. ביי קיין מיטל, עס איז שעדלעך צו דיין וועבזייַטל. אפילו ווען איר סקראַפּ דעם צופרידן, עס וועט נישט שעדיקן די שעם פון דיין אָנליין געשעפט.

אן אנדער בייַשפּיל פון עכט און לאַדזשיטאַמאַט סקרייפּינג איז אַגגראַגיישאַן זייטלעך אַזאַ ווי האָטעל בוקינג פּאָרטאַלס, קאָנצערט בילעט זייטלעך, און נייַעס אַוטלעץ. די באָץ וואס זענען פאַראַנטוואָרטלעך פֿאַר דיסטריביוטינג די אינהאַלט פון די וועב זייַטלעך באַקומען דאַטע דורך די אַפּיס און סקראַפּ עס ווי פּער דיין ינסטראַקשאַנז. זיי צילן צו פירן פאַרקער און עקסטראַקט אינפֿאָרמאַציע פֿאַר וועבמאַסטערס און פּראָוגראַמערז.

December 14, 2017