డేటా కంప్రెషన్ లో అద్భుతాలు సృష్టిస్తున్నారు..

అవకాశాలు అపారం.. మార్కెట్ విశాలం..

డేటా కంప్రెషన్ లో అద్భుతాలు సృష్టిస్తున్నారు..

Sunday March 06, 2016,

4 min Read


ప్రపంచమంతా డేటా చుట్టూ తిరుగుతోంది..అవును..!! ఫేస్ బుక్ లాంటి ఓ సోషల్ సైట్ లో ఒక్క రోజుకు ఎంత డేటా జమ అవుతుందో ఊహించగలరా? ఓ సాఫ్ట్ వేర్ అప్లికేషన్ తాలూకు డేటా ఏడాదికి ఎన్ని టీబీలు పోగుపడుతుందో తెలుసా..? సరే సింపుల్ కాలిక్యులేషన్.. ఓ సాధారణ వ్యక్తి లాప్ టాప్ లో నెలకు ఎన్ని జీబీలు చేరుతాయో ఊహించగలరు కదా.. మామూలు వ్యక్తే మెమొరీ సరిపోక నానా తంటాలు పడుతూ ఓ ఎక్స్ టెర్నల్ హార్డ్ డిస్క్ జేబులో పెట్టుకునే రోజులివి.. అలాంటిది ఓ కంపెనీ డేటా సేవ్ చేయాలంటే ఎన్ని తిప్పలు పడాలి. 

మీకో విషయం తెలుసా 295 బిలియన్ గిగాబైట్స్... అంటే ఎంత డేటానో ఊహకు కూడా అందని విషయం కదా.. ఇదీ 1986నుండి 2011వరకు రకరకాల మార్గాల్లో స్టోర్ అయిన డేటాసైజ్ ఇది. ఈ అయిదేళ్లలో ఇంకెంత సమాచారం పోగుపడి ఉంటుందో కదా..!! డేటా స్టోర్ చేయటం అంటే ఉన్నది ఉన్నట్టుగా కాకుండా ఓ పద్ధతి ప్రకారం తిరిగి ఉపయోగించటానికి వీలుగా, సైజ్ ని వీలైనంత తగ్గేలా కంప్రెస్ చేసి సర్వర్ లో భద్రపరచటం అన్నమాట. ఈ క్రమంలో ఆయా సంస్థలకు డేటాను సేవ్ చేయటం, తిరిగి వెలికి తీయటం చాలా ఖర్చుతో కూడుకున్నదిగా మారుతోంది. దీంతో ఆ రంగంలో కొత్త అవకాశాలు ఊపిరి పోసుకున్నాయి. ఇదే ష్రింక్ పుట్టుకకు కారణమయింది.. ఇది స్క్రిప్ట్ అనే కంపెనీ తయారు చేసిన కంప్రెషన్ సర్వర్. ఇది పలు రకాల అల్గారిథమ్స్ ఉపయోగించి డేటాని కంప్రెస్ చేసి స్టోర్ చేస్తుంది. 

"వాస్తవంగా చెప్పాలంటే ష్రింక్ ...డేటా ఎంట్రీ పాయింట్ కు, స్టోరేజ్ లొకేషన్ కు మధ్య మిడిల్ వేర్ లా పనిచేస్తుంది. అంటే, కంప్యూటర్ కీ బోర్డ్ లో ఎంటర్ చేసిన డేటాని, పోర్టల్స్ లో పోగవుతున్న సమాచారాన్ని ... వాటి కేటగిరీని బట్టి.. ఏ లొకేషన్ లో స్టోర్ చేయాలో, ష్రింక్ హ్యాండిల్ చేస్తుంది. డేటా ఏ మాత్రం నష్టపోకుండా, డేటాని కంప్రెస్ చేసే విధానాన్ని మేం కంప్యూటర్లకు నేర్పుతాం. ష్రింక్ అనేది ఇక్కడ కీలకపాత్ర వహిస్తుంది. ఇది లైనక్స్ ఆధారంగా పనిచేసే సర్వర్. "కార్తీక్, ఫౌండర్ అండ్ సీఈవో, స్క్రిప్ట్ కంపెనీ

ఇనిషియల్ వర్కింగ్ ప్రొటోటైప్ ని 60 రోజుల్లోనే తయారు చేశారు. అయితే మాన్యువల్ గా కంప్రెషన్ చేసే మెధడ్ చాలా టైమ్ తీసుకునేది.. నిజానికి మొదట ఈ తరహాలో ఆయా సంస్థల అవసరాలకు ఉపయోగపడేలా సాఫ్ట్ వేర్ ఒకటి తయారు చేస్తే చాలని భావించారు. కానీ, అది సరిపోదని అర్ధమయింది. దాంతో ష్రింక్ ని రూపొందించారు. 

ప్రొడక్ట్ తయారు చేయటం..

మొదట కంప్రెషన్ ప్రాసెస్ ని ఆటోమేట్ చేయటానికి అవసరమైన మోడల్ ని తయారు చేశారు. సిస్టమ్ ని ఎక్కువగా ఉపయోగించేకొద్దీ అది డేటాని మరింత షార్ప్ గా ఆర్గనైజ్డ్ గా కంప్రెస్ చేయగలుగుతుంది. ఇక ష్రింక్ ప్రీడిఫైన్డ్ ట్రెయినింగ్ డేటాతో వస్తుంది. ఒక్కమాటలో చెప్పాలంటే ఇది ఓ మనిషి ఆలోచించి నిర్ణయం తీసుకున్నట్టు షార్ప్ గా పనిచేస్తుంది. ఒక్కసారి డేటా ష్రింక్ ని చేరగానే అల్గారిథమ్ 1000డేటా పాయింట్స్ తో పోల్చుతుంది. ఫైల్ ని ఎనలైజ్ చేసిన తర్వాత కేర్ ఫుల్ గా కంప్రెస్ చేస్తుంది.

ష్రింక్ లో 16 డిఫరెంట్ అల్గారిథమ్స్ ఉంటాయి ఇది 6వేలకు పైగా ఫైల్ టైప్స్ ని సపోర్ట్ చేస్తుంది. దీనివల్ల ఎలాంటి పైల్ ని అయినా, కంప్రెస్ చేయగలుగుతుంది. ఒక్కసారి కంప్రెషన్ పూర్తి అయితే, ఓ రిపోర్ట్ ని జెనరేట్ చేస్తుంది. ఆ ఫైల్ ని అడ్మిన్ ముందే నిర్దేశించిన స్టోరేజ్ లొకేషన్ కి పంపుతుంది. ఫైల్ ని స్టోర్ చేయటం ఒక ఎత్తైతే, వెనక్కి రిట్రీవ్ చేయటం మరో ఎత్తు. ఈ ప్రాసెస్ లో స్టోరేజ్ లొకేషన్ నుండి వెలికి తీసిన ఫైల్ దాని ఒరిజినల్ పార్మాట్ కు డీకంప్రెస్ చేయబడుతుంది. ఆ తర్వాత యూజర్ కి ఉపయోగించటానికి పంపుతారు. 1.5 పెటా బైట్ డేటాతో ఈ సిస్టమ్ ని ఇప్పటివరకు టెస్ట్ చేసి సక్సెస్ అయ్యారు. అపరిమితమైన వేగమే ఈ సిస్టమ్ గొప్పతనం. కంప్రెషన్, డీ కంప్రెషన్ స్పీడ్ లు గతంలో ఎప్పుడూ చూడనివి. ఈ స్పీడ్ ఫ్యూచర్లో ఇంకా పెంచబోతున్నామంటాడు కార్తీక్.

స్క్రిప్ట్ వెనుక వెనుక కార్తీక్, స్వాతి కాకర్ల, అనే స్నేహితులున్నారు. ఇక మిగిలిన కోర్ టీమ్ అంతా గూగుల్ డెవలప్ గ్రూప్ నుండే కలిశారు. ఇప్పుడు పలు కంపెనీలు తమ అవసరాలకు ష్రింక్ సర్వర్ ని కొంటున్నాయి. యూజర్ ఇంటర్ ఫేస్ ద్వారా కంప్రెస్ చేసిన ఫైల్స్ ని యాక్సెస్ చేయగలుగుతున్నాయి. 

"ఎండ్ యూజర్స్ ఆర్కైవ్ చేసిన ఫైల్స్ ని మాత్రమే కాదు... ఏళ్ల తరబడి ఉపయోగించని పైల్స్ ని కూడా అలవోకగా రిట్రీవ్ చేసి ఉపయోగించేలా ష్రింక్ ఉపయోగపడుతుంది. ఈజ్ ఆఫ్ యూజ్ కస్టమర్లను ఆకట్టుకుంటోంది." కార్తీక్

 ఆలోచన నుండి పనిలోకి..

నిజానికి ఇలా డేటాను కంప్రెస్ చేసి స్టోర్ చేసే ప్లాట్ ఫాం బిల్డ్ చేయాలనే ఆలోచన అప్పుడప్పుడు వస్తూ ఉన్నా.. దానిపై ఎప్పుడూ సీరియస్ గా పనిచేసింది లేదు. కానీ, గూగుల్ డెవలపర్స్ గ్రూప్ లో మెంబర్ గా ఉన్న ఓ ఆర్గనైజేషన్ లో అపరిమితంగా వస్తున్న డేటాను మేనేజ్ చేయలేక పడుతున్న ఇబ్బందులు చూసిన తర్వాత.. ఈ దిశగా మళ్లాము అంటాడు కార్తీక్..

డేటా ను సరైన విధంగా కంప్రెస్ చేసి తిరిగి వాడుకునేలా సిద్ధంగా ఉంచటం అనేది చాలా పెద్ద విషయం. ఇది చాలాకాలంగా ఇండస్ట్రీని వేధిస్తున్న సమస్య కూడా. దీంతో ఇక్కడ చాలా అవకాశాలున్నాయని, ఛాలెంజింగ్ గా ఉందని గమనించి, సర్వర్లపై ప్రయోగాలు చేస్తూ ఇక్కడి వరకు వచ్చారు. కానీ, తొలి అడుగు తర్వాత అర్ధమయింది.. కళ్లముందున్న టాస్క్ ఎంత గట్టిదనే విషయం. ఓ దశలో అంతా ఆపేసి వెనక్కి మళ్లుదామనే ఆలోచనలూ వచ్చాయి. కానీ, చివరికి అంతు చూశారు. 

బండి పట్టాలెక్కింది.... ఫ్యూచర్ ప్లాన్స్ మిగిలున్నాయి.. 

నిజానికి విద్యార్ధిగా కాలేజ్ లో ఉన్నప్పుడే ఓ స్టార్టప్ తో చేతులు కాల్చుకున్న అనుభవం కార్తీక్ కి ఉంది. కానీ, ఇప్పుడలా కాకూడడదు. అన్ని ఆయుధాలతో, సరైన అనుభవంతో ఎటెంప్ట్ ఇవ్వాలి. అందుకే యాపిల్, పియర్సన్ ఎడ్యుకేషన్, విప్రో లాంటి సంస్థల్లో భిన్నమైన రంగాల్లో పనిచేసిన అనుభవం సాధించి దాన్ని ఇక్కడ ఉపయోగించాడు. ఇప్పుడు ష్రింక్ దగ్గర ఫార్చ్యూన్ 500 కంపెనీల్లో 10 పెద్ద కంపెనీలు కస్టమర్లు గా ఉన్నారు. ఇది లక్షల డాలర్ల రెవెన్యూని కూడా సాధిస్తోంది. ఈ ఏడాదిలో క్టసమర్ల సంఖ్యను, రెవిన్యూని కూడా డబుల్ చేయాలనే ఆలోచనతో ఉన్నారు. 

ష్రింక్ ఉపయోగిస్తున్న కస్టమర్లు కూడా చాలా సంతృప్తి వ్యక్తం చేస్తున్నారు. ఉదాహరణకు జీఎన్ ఈ సంస్థ.. అది దుబాయ్ లో ఆయిల్ పైపింగ్ మాన్యుఫాక్చరింగ్ రంగంలో ఉంది. ఆ సంస్థ చాలా అపనమ్మకంతోనే ష్రింక్ ని ఉపయోగించటం మొదలుపెట్టింది. కానీ, ఇప్పుడు ష్రింక్ తో తమ సంస్థ వ్యవహారాలు బ్రహ్మాండంగా చక్కబడ్డాయని ఫీడ్ బ్యాక్ ఇస్తోంది. 

మార్కెట్ , కాంపిటీషన్.. రెండూ ఎక్కువే..

డేటాను ఉపయోగిస్తూ, తయారు చేస్తూ నిరంతరం టీబీల కొద్దీ సమాచారం పోగుబడుతూ ఉండే ప్రపంచంలో కంప్రెషన్ అనేది చాలా అవసరంగా మారింది. ష్రింక్ ఈ కంప్రెషన్ ద్వారా డేటాలో ఉన్న డూప్లికేట్స్ ని తొలగించి ఓ పద్ధతి ప్రకారం తిరిగి ఉపయోగించుకునేలా రెడీ చేస్తుంది. స్టోరేజ్ కాస్ట్ ని అనూహ్యంగా తగ్గిస్తుంది. అందుకే ఈ రంగంలో అనేక కంపెనీలు ఎంటరవుతున్నాయి. ఇప్పటికే డిస్క్ డబులర్, సూపర్ స్టోర్ ప్రో లాంటి టూల్స్ లభిస్తున్నాయి. సన్ మైక్రో సిస్టమ్స్ లాంటి బడా సంస్థలు కూడా ఈ రంగంలో పనిచేస్తున్నాయి. ఇంకా చెప్పాలంటే చాలామంది ఈ స్పేస్ కు సంబంధించిన సమస్యకు ఇంకా సరైన పరిష్కారం లేదనే భావిస్తారు. అందుచేత ష్రింక్ లాంటి సర్వర్ కు, స్క్రిప్ట్ లాంటి కంపెనీ ఫ్యూచర్ కి ఢోకాలేదని తేల్చి చెప్పొచ్చు. 

image