Ո՞րն է տարբերությունը համակարգչային գիտության և տվյալների գիտության միջև:


պատասխանել 1:

Համակարգչային գիտությունը `վիճակագրական հաշվարկների իմաստով` տեղեկատվության (ցանկացած տեսակի) ուսումնասիրությունն է `օգտագործելով ալգորիթմներ, որոնք իրենց բնույթով մաթեմատիկական և վիճակագրական են: Այս իմաստով այն իրականում որպես բառ չի օգտագործվում. Հաջորդ բանը, որի մասին ես կարող եմ մտածել, բիոինֆորմատիկան է: Դրա առավել տարածված անունը ուսման տեսությունն է:

Համակարգչային գիտության մեջ համակարգչային գիտությունը տեղեկատվության, ալգորիթմների և համակարգիչների տեսական ուսումնասիրություն է:

Ակնհայտ է, որ երկուսն էլ անհրաժեշտ է հաշվի առնել տվյալների գիտության ցանկացած կիրառման մեջ, որը դեռևս բավականին վատ սահմանված է, բայց ընդհանուր առմամբ դիտարկվում է որպես վիճակագրության, ծրագրավորման, տեսական և կիրառական (սովորաբար տնտեսական) գիտելիքների, մաթեմատիկայի և այլոց մի ամբողջ այլ խառնուրդ: Բաներ Տվյալների գիտնականի առավել ճշգրիտ սահմանումներից մեկը, որը ես գիտեմ, դեռևս մեկն է, որը գիտի ավելի շատ վիճակագրություն, քան ծրագրավորող և ավելի շատ ծրագրավորողներ, քան վիճակագրագետը…, որը, ըստ սահմանման, շատ նյարդային է:

Եթե ​​գոնե կարողանանք համաձայնել, որ տվյալների գիտնականը տվյալների հետ կապված խնդիրներ է լուծում, համակարգչային գիտության առաջին բնութագիրը ընկնում է տվյալների գիտնականների մեծամասնության սահմաններում, իսկ երկրորդը ՝ կարևոր (հատկապես մեկի համար, ով շատ մանրակրկիտ է):


պատասխանել 2:

Ստորև տրված է հարցի իմ պատասխանը. Ո՞րն է տարբերությունը համակարգչային գիտության և տվյալների գիտության միջև:

ԹՈՓ 25 ՀԻՇՈՒՄՆԵՐ ԴԵՊՔ ՏԵՂԵԿԱՏՎԱԿԱՆ ԳԻՏՆԵ!

Ողջույն ընկերներ, ես 2014 թվականից աշխատում եմ գլխավոր որսորդական ընկերությունում, տվյալների գլխավոր գիտության, ԱՀ, խորը ուսուցման հիմնական ոլորտներում… Թույլ տվեք զարմանալի խորհուրդներ տալ, թե ինչպես դառնալ պրոֆեսիոնալ, ինչպես նկարագրված է ստորև: Հուսով եմ, որ սիրում եք: (Ref. Kdnuggets- ից):

1. Օգտագործեք Datta- ի արտաքին աղբյուրներ. Թվիթերներ ձեր ընկերության կամ ձեր մրցակիցների կամ Datta- ի վերաբերյալ ձեր մատակարարներից (օրինակ ՝ eBlast- ի անհատական ​​վիճակագրությունը այն տեղեկագրերի համար, որոնք մատչելի են մատակարարի վահանակների միջոցով կամ տոմս ներկայացնելով):

2. Միջուկային ֆիզիկոսները, մեխանիկական ճարտարագետները և բիոինֆորմատիկայի մասնագետները կարող են լինել Datta- ի հիանալի գիտնականներ:

3. stateիշտ ասեք ձեր խնդիրը և օգտագործեք ամուր չափիչներ ՝ Datta գիտական ​​նախաձեռնություններով նախատեսված վերադարձը (վերը նշված ելակետից):

4. Սկզբից օգտագործեք ճիշտ KPI- ները (հիմնական չափումները) և ճիշտ տվյալների բազան: Աղքատ հիմքերի պատճառով փոփոխությունները շատ թանկ են: Սա պահանջում է ձեր տվյալների մանրակրկիտ վերլուծություն ՝ օգտակար տվյալների բազաներ ստեղծելու համար:

5. Հղում կատարեք այս ռեսուրսին. Տվյալների գաղտնապահ դառնալու 74 գաղտնիք

6. Մեծ տվյալների դեպքում ուժեղ ազդանշանները (ծայրահեղությունները) սովորաբար աղմուկ են: Ահա լուծումը:

7. Մեծ տվյալների տվյալների աղբյուր, a- ն ունի ավելի քիչ արժեք, քան օգտակար տվյալների աղբյուրը, ա.

8. Օգտագործեք Big Dat ՝ երրորդ կողմի արտադրանք, մրցակցային տեղեկատվության համար:

9. Դուք կարող եք ստեղծել բավականին էժան, մեծ, մասշտաբային և կայուն գործիքներ բավականին արագ ՝ առանց օգտագործելու հնացած վիճակագրական գիտությունը: Մտածեք մոդելներից զերծ տեխնիկայի մասին:

10. Big Dat, ավելի հեշտ և էժան է, քան կարծում եք: Ստացեք ճիշտ գործիքներ: Ահա ինչպես սկսել:

11. Հարաբերակցությունը պատճառաբանություն չէ: Այս հոդվածը կարող է օգնել ձեզ այս խնդրի լուծման հարցում: Կարդացեք այս բլոգը և գիրքը:

12. Պետք չէ մշտապես պահպանել ձեր բոլոր տվյալները: Օգտագործեք խելացի սեղմման տեխնիկա և գործադրեք վիճակագրական ամփոփագրեր միայն հին տվյալների վրա: Ա.

13. Մի մոռացեք ճշգրտել ձեր չափումները, երբ ձեր տվյալները փոխվում են ՝ միտումնավոր նպատակներով հետևողականությունն ապահովելու համար:

14. Առանց այնտեղ, աղյուսակները շատ բան կարելի է անել, հատկապես մեծ da, ta- ի համար:

15. Միշտ ներառեք EDA և DOE (հետախուզական վերլուծություն / թեստավորման պլանավորում) գիտական ​​նախագծերում `վաղ փուլում: Միշտ ստեղծեք da, ta բառարան բառարան: Եվ հետևեք յուրաքանչյուր գիտական ​​նախագծի կյանքի ավանդական ցիկլի:

16. Da, ta- ն կարող է օգտագործվել բազմաթիվ նպատակների համար.

- որակի ապահովում

- գտնել գործող գործող օրինաչափություններ (ֆոնդային առևտուր, խարդախության հայտնաբերում)

- ձեր բիզնեսի հաճախորդներին վաճառելու համար

- որոշումներն ու գործընթացները օպտիմալացնելու համար (Գործառնությունների հետազոտություն)

- հետաքննության և հայտնաբերման համար (IRS, դատավարություն, խարդախության հայտնաբերում, արմատային պատճառների վերլուծություն)

- Հաղորդակցություն մեքենայից մեքենային (ավտոմատ մրցույթային համակարգեր, ավտոմատ վարում)

- Կանխատեսումներ (վաճառքի կանխատեսումներ, աճի և ֆինանսական կանխատեսումներ, եղանակ)

17. Մի պահեք Excel- ը: Ընդունեք լույսի վերլուծությունը: Այնտեղ, ta + մոդելները + աղիքային զգացողությունները + ինտուիցիան կատարյալ խառնուրդ է: Մի հանեք այս բաղադրիչներից որևէ մեկը ձեր որոշումների կայացման գործընթացում:

18. Կոմպոզիտային չափումների ուժը լծակ թողնելով. Da տվյալների բազայի դաշտերից ստացված KPI- ները, որոնք շատ ավելի կանխատեսելի են, քան տվյալների բազաների բազաների սկզբնական չափումները: Օրինակ, ձեր da, tabase- ը կարող է պարունակել մեկ բառի դաշտ, բայց չի տարբերակում օգտագործողի հարցման և որոնման կատեգորիայի միջև (երբեմն այն պատճառով, որ d, ata- ը գալիս է տարբեր աղբյուրներից և խառնվում են միասին): Անաչեք խնդիրը և ստեղծեք նոր մետրիկա, որը կոչվում է Keyword Type - կամ d, ata աղբյուր: Մեկ այլ օրինակ `IP հասցեների կատեգորիա, հիմնական մետր, որը պետք է ստեղծվի և ավելացվի թվային վերլուծության բոլոր նախագծերում:

19. Երբ ձեզ հարկավոր է իրական ժամանակի վերամշակում: Եթե ​​խարդախության հայտնաբերումը կրիտիկական է կամ գաղտնի գործարքներ են մշակվում, ապա դրանք (վարկային քարտերի խարդախության հայտնաբերում, 911 զանգ): Հակառակ դեպքում, հետաձգված վերլուծությունը (մի քանի վայրկյանով մինչև 24 ժամ ուշացումով) բավարար է:

20. Համոզվեք, որ ձեր զգայուն դ, Ata- ը լավ պաշտպանված է: Համոզվեք, որ ձեր ալգորիթմները չեն կարող շահարկել քրեական հաքերների կամ բիզնես հակերների կողմից (լրտես ձեր ընկերությանը և գողանալ այն ամենը, ինչ կարող են, օրինական կամ ապօրինի կերպով, և փոխզիջել ձեր ալգորիթմները, ինչը կարող է հանգեցնել եկամտի զգալի կորուստների): Բիզնեսի հակերության օրինակի համար տե՛ս սույն հոդվածի 3-րդ մասը:

21. Խառնել մի քանի մոդելներ `ճանաչելու բազմաթիվ տեսակի օրինաչափություններ: Այս մոդելների միջին ցուցանիշը: Ահա մոդելների խառնման մի պարզ օրինակ:

22. Ծրագրեր գնելուց առաջ ճիշտ հարցեր տվեք:

23. Գործադրեք Մոնտե Կառլոյի սիմուլյացիաները, նախքան երկու սցենար ընտրելը:

24. Օգտագործեք մի քանի աղբյուրներ նույն d, ata- ի համար. Ձեր ներքին աղբյուրը և d- ը ՝ մեկ կամ երկու մատակարարներից: Հասկացեք այս տարբեր աղբյուրների միջև եղած անհամապատասխանությունները `ավելի լավ պատկերացում կազմելու համար, թե ինչպիսին պետք է լինեն իրական թվերը: Երբեմն մեծ շեղումներ տեղի են ունենում, երբ պրովայդերներից մեկի կողմից մետրային բնորոշումը փոխվում է կամ ներքին փոփոխվում է, կամ երբ տվյալները փոխվել են (որոշ ոլորտներ այլևս չեն դիտվում): Դասական օրինակ է վեբ տրաֆիկի տվյալները. Օգտագործեք ներքին տեղեկամատյանային ֆայլերը, Google Analytics- ը և մեկ այլ մատակարար (օրինակ ՝ շեշտադրում) ՝ այս տվյալները հետևելու համար:

25. Արագ առաքումը ավելի լավ է, քան ծայրահեղ ճշգրտությունը: Համենայն դեպս, բոլոր գրառումները կեղտոտ են: Գտեք կատարյալ փոխզիջում կատարելության և արագ վերադարձի միջև: