Примери коришћења Великих извора података на Српском и њихови преводи на Енглески
{-}
-
Colloquial
-
Ecclesiastic
-
Computer
-
Latin
-
Cyrillic
Најчешће разматрана карактеристика великих извора података је да су БИГ.
Затим, у одјељку 2. 3,описујем десет заједничких карактеристика великих извора података.
Далеко од препознатљивих, много великих извора података имају информацију да је осетљив.
Као и природних експеримената,одговарајући је дизајн који такође има користи од великих извора података.
Слика 3. 12: Два начина комбиновања великих извора података и података истраживања.
Combinations with other parts of speech
Употреба придјева
главни извордобар изворodličan izvorдругих извораједини изворразличитих извораobnovljivih izvorapouzdan izvorважан изворbogat izvor
Више
Употреба са глаголима
извори кажу
извор је рекао
извори тврде
извори наводе
извор је додао
постати изворпостаје изворизвор љубави
kaže izvorizvor toplote
Више
Разумијевање ових 10 општих карактеристика је користан први корак ка учењу из великих извора података.
Као што сам описао у поглављу 2, већина великих извора података није доступна истраживачима.
За потребе друштвена истраживања, мислим даје корисно да се направи разлика између две врсте великих извора података.
Већина великих извора података је непотпуна, у смислу да немају информације које желите за ваше истраживање.
Становањски дрифт, искоришћење дрифта исистемски дрифт отежавају кориштење великих извора података за проучавање дугорочних трендова.
Имајући у виду ових десет карактеристике великих извора података и својствене ограничења и савршено посматраних података, каква истраживања стратегија су корисни?
Како овај примјер илуструје,кориштење нерепрезентативних великих извора података за оба извјештавања узорка може бити врло погрешно.
За приступа машинског учења који покушавају да се аутоматски открити природне експерименте у великих извора података, погледајте Jensen et al.
Већина друштвених научника већ је упозната са процесом чишћења података великог обима социјалног истраживања, али изгледа даје чишћење великих извора података теже.
Ако је истина, чини се да ово озбиљно ограничава оно што се може научити из великих извора података, јер многи од њих нису представници.
Као и многи од великих извора података у поглављу 2, каталистички мастер фајл није укључивао већину демографских, ставничких и понашања које су потребни Ансолабехеру и Херсху.
Ови извори промјена су понекад интересантна питања истраживања, алиове промјене компликују способност великих извора података да прате дугорочне промјене током времена.
Ови четири примера показују да ће моћна стратегија у будућности бити обогаћивање великих извора података, који нису створени за истраживање, уз додатне информације које их чине бољим за истраживање( Groves 2011).
Истраживачи, наравно, то могу урадити у прошлости, алиу дигиталном добу скала је сасвим другачија, чињеница коју су многи обожаватељи великих извора података проглашавали више пута.
Истовремено са овим распада друге ере приступи узорковања и интервјуа,постоји све већа доступност великих извора података( види Поглавље 2) који изгледа да прети да замени истраживања.
Прво, постоји огромна вриједност и од обогаћивања великих извора података са подацима истраживања и од обогаћивања података истраживања са великим изворима података( можете видети ову студију било који начин).
Али, Књига Живота се такође може назвати базу података пропасти( Ohm 2010), који се може користити за све врсте неморално сврхе, као штоје описано више у наставку, када говорим о осјетљивости информација прикупљених од стране великих извора података испод и у поглављу 6( Етхицс).
Практичне и основне ограничења великих извора података, и како они могу бити превазиђени са истраживањима, илустровани су Моира Бурке и Роберта Швабо је( 2014) о томе како је снага пријатељства под утицајем интеракције на Фацебоок.
Ово поглавље има три дела. Прво, у члану 2. 2, ја описати велике податке детаљније и разјаснити фундаменталну разлику између ње и података који су генерално користи за друштвена истраживања у прошлости. Затим, у одељку 2. 3,ја описати десет заједничких карактеристика великих извора података.
Мислим да је крајњи извор ове потешкоће тај што многи од ових великих извора података никада нису имали намеру да буду искоришћени за истраживање, тако да се они не прикупљају, чувају и документују на начин који олакшава чишћење података. .
Ово поглавље има три дијела. Прво, у одјељку 2. 2, детаљније описујем велике изворе података и разјашњавам основну разлику између њих и података који су у прошлости обично кориштени за друштвена истраживања. Затим, у одјељку 2. 3,описујем десет заједничких карактеристика великих извора података.
Мјерење у великим изворима података је много мање вјероватно да ће промијенити понашање.
Велики извори података могу бити напуњен са смећа и спам.
У закључку, велики извори података за данас( и сутра) обично имају десет карактеристике.
Велики извори података данас, и вероватно сутра, имају тенденцију да имају 10 карактеристика.