Document Grinding

    0
    20

    Document Grinding सार्थक डेटा निकालने के लिए Documents का विश्लेषण करने की प्रक्रिया है। यह शब्द अक्सर Computer Hacking से जुड़ा होता है, क्योंकि हैकर गोपनीय डेटा को प्रकट करने के लिए Documents को “Grind” सकते हैं। हालाँकि, document grinding का उपयोग गैर-दुर्भावनापूर्ण उद्देश्यों के लिए भी किया जाता है। उदाहरणों में अज्ञात फ़ाइल प्रकारों की पहचान करना और फ़ाइल metadata देखना शामिल है।

    Plain Text और Binary Files दोनों पर Document Grind संभव है।

    Text फ़ाइलें

    Text Files को Grind करना एक सरल प्रक्रिया है क्योंकि वे data को plain Text के रूप में store करती हैं। आप grep या किसी अन्य खोज उपयोगिता जैसे tool का उपयोग करके टेक्स्ट दस्तावेज़ में वर्णों और strings की खोज कर सकते हैं। चूंकि टेक्स्ट प्रोसेसिंग एक अपेक्षाकृत तेज़ computer operation है, इसलिए एक सेकंड से भी कम समय में कई बड़े दस्तावेज़ों को grind संभव हो सकता है।

    दस्तावेज़ grinding के लिए लक्षित सामान्य पाठ फ़ाइल प्रकारों में log files (.LOG, .TXT) और configuration files (.CONF, .CNF) शामिल हैं। उदाहरण के लिए, यदि कोई hacker वेब सर्वर तक पहुँच प्राप्त करता है, तो वह इन फ़ाइलों को उपयोगकर्ता नाम, password और अन्य secret data के लिए खोज सकता है।

    document grinding hindi

    Binary फ़ाइलें

    Binary files में कुछ plain text हो सकता है, लेकिन वे बाइनरी डेटा – 1s और 0s भी संग्रहीत करते हैं। बाइनरी डेटा को पीसना अधिक कठिन है क्योंकि इसे टेक्स्ट सर्च टूल से नहीं खोजा जा सकता है। इसके अतिरिक्त, कई बाइनरी फ़ाइलें एक मालिकाना फ़ाइल स्वरूप में सहेजी जाती हैं, जो कि संबंधित एप्लिकेशन के बिना पार्स करना मुश्किल है। इसलिए बाइनरी दस्तावेज़ पीस आम तौर पर एक दस्तावेज़ के शीर्षलेख और पाद लेख पर केंद्रित होता है, जिसमें सादा पाठ हो सकता है। इसका उद्देश्य फ़ाइल मेटाडेटा को निकालना भी हो सकता है।

    कई बाइनरी फाइलों में फ़ाइल के शीर्षलेख में फ़ाइल प्रकार के बारे में जानकारी होती है। उदाहरण के लिए, नमूना छवि में, शीर्षलेख में “PNG” अक्षर इंगित करते हैं कि फ़ाइल एक पीएनजी छवि है। यह जानकारी फ़ाइल प्रकार की पहचान करने के लिए उपयोगी है क्योंकि इसमें फ़ाइल extension नहीं है। इसी तरह, डिजिटल फ़ोटो में अक्सर छिपा हुआ EXIF ​​डेटा होता है जिसे फ़ोटो लेते समय सहेजा जाता है। एक छवि-देखने का कार्यक्रम या दस्तावेज़ पीसने वाली script इस जानकारी का पता लगाने और निकालने में सक्षम हो सकती है।

    Previous articleZip
    Next articleeBook
    Anurag Shukla के तकनीकि के प्रति जुनून ने उन्हें एक Technical लेखक और blogger बनने के लिए प्रेरित किया। स्नातक की डिग्री प्राप्त करने के बाद, उन्हें Informative और उपयोगी Content लिखने के लिए अपने Technical Knowledge का उपयोग करने में आनंद आता है।