Ево питања за интервју за моделирање података како за свеже, тако и за искусне кандидате.
1) Шта је моделирање података?
Моделовање података је поступак стварања модела за чување података у бази података. То је концептуални приказ објеката података, асоцијације између различитих објеката података и правила.
2) Објаснити разне врсте модела података
Постоје углавном три различите врсте модела података:
Концептуално: Концептуални модел података дефинише шта систем треба да садржи. Овај модел обично креирају пословне интересне групе и архитекте података. Сврха је организовати, обухватити и дефинисати пословне концепте и правила.
Логично: Дефинише како систем треба применити без обзира на ДБМС. Овај модел обично креирају архитекте података и пословни аналитичари. Сврха је израда техничке мапе правила и структура података.
Физички: Овај модел података описује како ће се систем применити помоћу одређеног ДБМС система. Овај модел обично креирају ДБА и програмери. Сврха је стварна имплементација базе података.
3) Објасните табелу чињеница и чињеница
Чињеница представља квантитативне податке. На пример, нето доспели износ. Табела чињеница садржи нумеричке податке као и стране кључеве из димензионалних табела.
4) Наведите различите шеме дизајна у моделирању података
Постоје две различите врсте шема за моделирање података: 1) Шема звезда и 2) Шема пахуљица
5) Када треба размотрити денормализацију?
Денормализација се користи када је табела пуно укључена у преузимање података. Користи се за изградњу складишта података.
6) Објасните димензију и атрибут
Димензије представљају квалитативне податке. На пример, производ, класа, план итд. Табела димензија садржи текстуалне или описне атрибуте. На пример, категорија производа и назив производа су два атрибута табеле димензија производа.
7) Шта је чињеница мање чињеница?
Чињеница мање чињеница је табела која нема мерење чињеница. Садржи само кључеве димензија.
8) Шта је аналитика у меморији?
Аналитика у меморији је процес кеширања базе података у РАМ меморији.
9) Која је разлика између ОЛТП и ОЛАП?
ОЛТП | ОЛАП |
ОЛТП је мрежни систем за трансакције. | ОЛАП је поступак мрежне анализе и преузимања података. |
Карактерише га велики број кратких интернетских трансакција. | Карактерише га велика количина података. |
ОЛТП користи традиционални ДБМС. | ОЛАП користи складиште података. |
Табеле у бази података ОЛТП су нормализоване. | Табеле у ОЛАП-у нису нормализоване. |
Његово време одзива је у милисекунди. | Његово време одзива је секунда до минута. |
ОЛТП је дизајниран за пословање у реалном времену. | ОЛАП је дизајниран за анализу пословних мера по категоријама и атрибутима. |
10) Шта је сто?
Колекција редова и колона назива се табелом. Свака колона има тип података. Табела садржи повезане податке у табеларном формату.
11) Шта је колона?
Колона или поље је вертикални распоред података који садрже повезане информације.
12) Дефинисати оскудност података
Шпарност података је израз који се користи за количину података о ентитету / димензији модела.
13) Шта је композитни примарни кључ?
Састављени примарни кључ односи се на случај када се користи више колона табеле као део примарног кључа.
14) Шта је примарни кључ?
Примарни кључ је колона или група колона која неједнако идентификују сваки ред у табели. Вредност примарног кључа не сме бити нула. Свака табела мора да садржи један примарни кључ.
15) Објасните страни кључ
Страни кључ је група атрибута која се користи за повезивање надређене и подређене табеле. Вредност колоне страног кључа, која је доступна у подређеној табели, односи се на вредност примарног кључа у надређеној табели.
16) Шта су метаподаци?
Метаподаци описују податке о подацима. Показује која врста података се заправо чува у систему базе података.
17) Шта је дата март?
Дата март је сажета верзија складишта података и дизајниран је за употребу у одређеном одељењу, јединици или скупу корисника у организацији. Нпр. Маркетинг продаја, ХР или финансије.
18) Шта је ОЛТП?
Обрада трансакција на мрежи, кратко позната и као ОЛТП, подржава апликацију оријентисану на трансакције у трослојној архитектури. ОЛТП управља свакодневном трансакцијом компаније или организације.
19) Који су примери ОЛТП система?
Примери ОЛТП система су:
- Слање текстуалне поруке
- Додајте књигу у корпу
- Онлајн резервација авионских карата
- Интернет банкарство
- Унос поруџбине
20) Шта је ограничење провере?
Ограничење провере користи се за верификацију опсега вредности у колони.
21) Наведите типове нормализације?
Типови нормализација су: 1) први нормални облик, 2) други нормални облик, 3) трећи нормални облици, 4) боице-цодд четврти и 5) пети нормални облици.
22) Шта је инжењеринг података унапред?
Терминско инжењерство је технички израз који се користи за описивање процеса аутоматског превођења логичког модела у физичку машину.
23) Шта је ПДАП?
То је коцка података која податке чува као резиме. Кориснику помаже да брзо анализира податке. Подаци у ПДАП-у се чувају на начин да се извештавање може извршити с лакоћом.
24) Објасните дизајн базе података шеме пахуљица снега
Шема пахуљица је распоред табеле димензија и табеле чињеница. Генерално, обе табеле су даље подељене на више табела димензија.
25) Објаснити службу анализе
Услуга анализе даје комбиновани приказ података који се користе у претраживању података или ОЛАП-у.
26) Шта је алгоритам кластерисања секвенци?
Алгоритам кластерирања секвенци прикупља путање које су сличне или повезане једна са другом и секвенце података који имају догађаје.
27) Шта су дискретни и континуирани подаци?
Дискретни подаци су коначни подаци или дефинисани подаци. Нпр. Пол, бројеви телефона. Континуирани подаци су подаци који се континуирано и уређено мењају. Нпр. Године.
28) Који је алгоритам временских серија?
Алгоритам временских серија је метода за предвиђање континуираних вредности података у табели. Нпр. Учинак Један запослени може предвидети добит или утицај.
29) Шта је пословна интелигенција?
БИ (Бусинесс Интеллигенце) је скуп процеса, архитектуре и технологије који претварају сирове податке у значајне информације које покрећу профитабилне пословне акције. То је пакет софтвера и услуга за претварање података у интелигенцију и знање које се могу применити.
30) Шта је бит мапирани индекс?
Битмап индекси су посебна врста индекса базе података која користи битмапе (низове битова) за одговарање на упите извршавањем битовних операција.
31) Објасните детаљно складиштење података
Складиштење података је процес за прикупљање и управљање подацима из различитих извора. Пружа смислен увид у пословна предузећа. Складиштење података се обично користи за повезивање и анализу података из хетерогених извора. То је језгро БИ система који је направљен за анализу података и извештавање.
32) Шта је димензија смећа?
Смеће димензија комбинује две или више сродних снага у једну димензију. То су обично логичке вредности или вредности заставе.
33) Објасните шему података
Шема података је дијаграмски приказ који илуструје односе података и структуре.
34) Објасните учесталост прикупљања података
Учесталост прикупљања података је стопа прикупљања података. Такође пролази кроз различите фазе. Те фазе су: 1) издвајање из различитих извора, 3) трансформисање, 4) чишћење и 5) складиштење.
35) Шта је кардиналност базе података?
Кардиналност је нумерички атрибут односа између два ентитета или скупа ентитета.
36) Које су различите врсте кардиналних односа?
Различите врсте кључних кардиналних односа су:
- Односи један на један
- Односи један према више
- Везе према једном
- Односи много према многима
37) Дефинишите критични фактор успеха и наведите његове четири врсте
Критични фактор успеха је повољан резултат било које активности потребне да би организација постигла свој циљ.
Четири врсте критичног фактора успеха су:
- Индустријски ЦСФ-ови
- Стратешки ЦСФ
- Заштита животне средине
- Привремени ЦСФ
38) Шта је рударење подацима?
Рударство података је мултидисциплинарна вештина која користи машинско учење, статистику, АИ и технологију база података. Све се односи на откривање неслућених / раније непознатих веза међу подацима.
39) Која је разлика између шеме звезда и шеме пахуљица?
Шема звезда | Шема пахуљица |
Хијерархије димензија чувају се у табели димензија. | Хијерархије су подељене у посебне табеле. |
Садржи табелу чињеница окружену табелама димензија. | Табела чињеница окружена табелом димензија која је пак окружена табелом димензија |
У шеми звезда, само једно спајање ствара везу између табеле чињеница и било које табеле димензија. | Шема пахуљице захтева много удруживања да би преузела податке. |
Има једноставан дизајн базе података | Има сложен дизајн базе података |
Денормализована структура података и упити такође раде брже. | Нормализована структура података. |
Висок ниво сувишности података | Веома низак ниво редунданције података |
Нуди упите са бољим перформансама помоћу опције Стар Јоин Куери Оптимизатион. Табеле могу бити повезане са више димензија. | Шему снежне пахуљице представља централизована табела чињеница која је мало вероватно повезана са више димензија. |
40) Шта је идентификовање односа?
Идентификовање односа ентитета у ДБМС-у користи се за идентификовање односа између два ентитета: 1) јак ентитет и 2) слаб ентитет.
41) Шта је саморекурзивна веза?
Рекурзивни однос је самостални ступац у табели који је повезан са примарним кључем исте табеле.
42) Објаснити релационо моделирање података
Релационо моделирање података представља представљање објеката у релационој бази података, што је обично нормализовано.
43) Шта је аналитика предиктивног моделирања?
Процес валидације или тестирања модела који би се користио за предвиђање тестирања и валидације исхода. Може се користити за машинско учење, вештачку интелигенцију, као и за статистику.
44) Која је разлика између логичког и физичког модела података?
Логички модел података | Физички модел података |
Логички модел података може логично дизајнирати захтеве пословања. | Физички модел података пружа информације о циљном извору базе података и његовим својствима. |
Одговорна је за стварну примену података који се чувају у бази података. | Физички модел података помаже вам да направите нови модел базе података од постојећег и примените референцијално ограничење интегритета. |
Садржи ентитет, атрибуте примарног кључа, инверзијске кључеве, алтернативни кључ, правило, пословни однос, дефиницију итд. | Физички модел података садржи табелу, ограничења кључа, јединствени кључ, колоне, страни кључ, индексе, подразумеване вредности итд. |
45) Које су различите врсте ограничења?
Различити тип ограничења могу бити јединствене, нулл вредности, страни кључеви, сложени кључ или ограничење провере итд.
46) Шта је алат за моделирање података?
Алат за моделирање података је софтвер који помаже у конструисању протока података и односа између података. Примери таквих алата су Борланд Тогетхер, Алтова Датабасе Спи, цасевисе, Цасе Студио 2 итд.
47) Шта је хијерархијски ДБМС?
У хијерархијској бази података подаци модела су организовани у структуру налик стаблу. Подаци се чувају у хијерархијском формату. Подаци су представљени коришћењем односа родитеља и детета. У хијерархијском ДБМС родитељ може имати много деце, деца имају само једног родитеља.
48) Који су недостаци хијерархијског модела података?
Недостаци хијерархијског модела података су:
- Није флексибилан јер треба времена да се прилагоди променљивим потребама предузећа.
- Структура поставља питање у међуресорској комуникацији, вертикалној комуникацији, као и међуагенцијској комуникацији.
- Хијерархијски модел података може створити проблеме нејединства.
49) Објасните приступ моделирања података вођен процесом
Приступ вођен процесом који се користи у моделирању података следи корак по корак методу односа између модела односа ентитета и организационог процеса.
50) Које су предности коришћења моделирања података?
Предности употребе моделирања података у складишту података су:
- Помаже вам у управљању пословним подацима тако што их нормализујете и дефинишете њихове атрибуте.
- Моделирање података интегрише податке различитих система како би се смањила сувишност података.
- Омогућава стварање ефикасног дизајна базе података.
- Моделирање података помаже организационом одељењу да функционише као тим.
- Омогућава лак приступ подацима.
51) Који су недостаци коришћења моделирања података?
Мане употребе моделирања података су:
- Има мање структурне независности
- Може систем учинити сложеним.
52) Шта је индекс?
Индекс се користи за колону или групу колона за брзо преузимање података.
53) Које су карактеристике логичког модела података?
Карактеристике логичког модела података су:
- Описује потребе за подацима за један пројекат, али би могао да се интегрише са другим логичким моделима података на основу обима пројекта.
- Дизајниран и развијен независно од ДБМС-а.
- Атрибути података ће имати типове података са тачним прецизностима и дужином.
- Процеси нормализације на моделу, који се обично примењују обично до 3НФ.
54) Које су карактеристике физичког модела података?
Карактеристике физичког модела података су:
- Физички модел података описује потребе за подацима за један пројекат или апликацију. Може се интегрисати са другим физичким моделима података на основу обима пројекта.
- Модел података садржи везе између табела које се баве кардиналношћу и поништавањем веза.
- Развијено за одређену верзију ДБМС-а, локацију, складиштење података или технологију која ће се користити у пројекту.
- Ступци треба да имају тачне типове података, додељене дужине и подразумеване вредности.
- Дефинисани су примарни и страни кључеви, прикази, индекси, приступни профили и овлашћења итд.
55) Које су две врсте техника моделирања података?
Две врсте техника моделирања података су: 1) модел односа ентитета (ЕР) и 2) УМЛ (обједињени језик за моделирање).
56) Шта је УМЛ?
УМЛ (Унифиед Моделинг Лангуаге) је универзални језик за развој база података и језик за моделирање у пољу софтверског инжењерства. Главна намера је пружити уопштен начин за визуелизацију дизајна система.
57) Објаснити објектно оријентисани модел базе података
Објектно оријентисани модел базе података је колекција објеката. Ови објекти могу имати придружене особине као и методе.
58) Шта је мрежни модел?
То је модел који је изграђен на хијерархијском моделу. Омогућава више веза за повезивање записа, што указује на то да има више записа. Могуће је конструисати скуп матичних записа и подређених записа. Сваки запис може припадати више скупова који вам омогућавају да изводите сложене односе табеле.
59) Шта је хеширање?
Хасхинг је техника која се користи за претрагу свих вредности индекса и проналажење жељених података. Помаже у израчунавању директне локације података који се снимају на диск без употребе структуре индекса.
60) Шта су пословни или природни кључеви?
пословни или природни кључеви је поље које јединствено идентификује ентитет. На пример, ИД клијента, број запосленог, е-маил итд.
61) Шта је сложени кључ?
Када се за представљање кључа користи више поља, то се назива сложеним кључем.
62) Шта је први нормални облик?
Први нормални облик или 1НФ је својство релације доступно у релационом систему управљања базом података. Било која релација назива се првом нормалном формом ако домен сваког атрибута садржи вредности које су атомске. Садржи једну вредност са тог домена.
63) Која је разлика између примарног и страног кључа?
Примарни кључ | Страни кључ |
Примарни кључ вам помаже да јединствено идентификујете запис у табели. | Страни кључ је поље у табели које је примарни кључ друге табеле. |
Примарни кључ никада не прихвата нулл вредности. | Страни кључ може прихватити више нулл вредности. |
Примарни кључ је кластерисани индекс, а подаци у ДБМС табели су физички организовани у низу кластерисаног индекса. | Страни кључ не може аутоматски да креира индекс, кластериран или некластерисан. Међутим, можете ручно да креирате индекс на страном кључу. |
Можете имати један примарни кључ у табели. | У табели можете имати више страних кључева. |
64) Који су захтеви другог нормалног облика?
Захтеви другог нормалног облика су:
- Требало би да буде у првом нормалном облику.
- Не садржи ниједан не-главни атрибут, који функционално овиси о било којем подскупу кандидата кључа релације табеле.
65) Која су правила за трећу нормалну форму?
Правила за треће нормалне форме су:
- Требало би да буде у другој нормалној форми
- Нема прелазне функционалне зависности.
66) Каква је важност употребе кључева?
- Тастери вам помажу да препознате било који ред података у табели. У стварној апликацији табела може садржати хиљаде записа.
- Кључеви осигуравају да можете јединствено идентификовати запис табеле упркос овим изазовима.
- Омогућава вам успостављање везе између и идентификовање везе између табела
- Помоћи вам да наметнете идентитет и интегритет у вези.
67) Шта је сурогат кључ?
Вештачки кључ чији је циљ јединствена идентификација сваког записа назива се сурогат кључем. Ове врсте кључева су јединствене јер се креирају када немате ниједан природни примарни кључ. Они не дају никакво значење подацима у табели. Замјенски кључ је обично цијели број.
68) Објасните детаљно алтернативни тастер
Алтернативни кључ је колона или група колона у табели која јединствено идентификује сваки ред у тој табели. Табела може да има више избора за примарни кључ, али само један може да се постави као примарни кључ. Сви кључеви који нису примарни кључи називају се алтернативни кључеви.
69) Шта је четврти нормални облик у ДБМС-у?
Четврти нормални облик је ниво нормализације базе података на којем не сме бити не тривијалне зависности осим кандидата.
70) Шта је систем управљања базом података?
Систем за управљање базом података или ДБМС је софтвер за складиштење и преузимање корисничких података. Састоји се од групе програма који манипулишу базом података.
71) Које је правило петог нормалног облика?
Сто је 5 -ог нормална форма само ако је то у 4 -ог нормална форма, а не може се раставити у било ком броју мањих столова без губитка података.
72) Шта је нормализација?
Нормализација је техника дизајнирања базе података која организује табеле на начин који смањује сувишност и зависност података. Веће табеле дели на мање табеле и повезује их помоћу односа.
73) Објасните карактеристике система за управљање базама података
- Пружа сигурност и уклања вишак
- Самоописана природа система база података
- Изолација између програма и апстракције података
- Подршка више приказа података.
- Дељење података и обрада вишекорисничких трансакција
- ДБМС омогућава ентитетима и односима међу њима да формирају табеле.
- Прати концепт АЦИД (Атомицити, Цонсистенци, Исолатион, анд Трабилити).
- ДБМС подржава вишекорисничко окружење које омогућава корисницима паралелни приступ и приступ подацима и управљање њима.
74) Наведите популарни софтвер за ДБМС
Популарни ДБМС софтвер је:
- МиСКЛ
- Мицрософт Аццесс
- Орацле
- ПостгреСКЛ
- дбасе
- ФокПро
- СКЛите
- ИБМ ДБ2
- Мицрософт СКЛ Сервер.
75) Објасните појам РДБМС
Релациони систем за управљање базама података је софтвер који се користи за чување података у облику табела. У овој врсти система подацима се управља и чувају у редовима и колонама, што је познато као корпе и атрибути. РДБМС је моћан систем за управљање подацима и широко се користи широм света.
76) Које су предности модела података?
Предности модела података су:
- Главни циљ дизајнирања модела података је осигурати да објекти података које нуди функционални тим буду тачно представљени.
- Модел података треба да буде довољно детаљан да се користи за изградњу физичке базе података.
- Информације у моделу података могу се користити за дефинисање односа између табела, примарног и страног кључа и ускладиштених процедура.
- Модел података помаже предузећима да комуницирају унутар и међу организацијама.
- Модел података помаже у документовању мапирања података у ЕТЛ процесу
- Помозите у препознавању исправних извора података за попуњавање модела
77) Који су недостаци модела података?
Мане модела података су:
- Да би се развио модел података, треба знати физичке карактеристике података који се чувају.
- Ово је навигациони систем који производи сложени развој апликација и управљање њима. Дакле, потребно је познавање биографске истине.
- Још мање промене у структури захтевају модификацију у целој апликацији.
- У ДБМС-у не постоји скуп језика за манипулацију подацима.
78) Објасните разне врсте табела чињеница
Постоје три врсте табела чињеница:
- Адитив: То је мера која се додаје било којој димензији.
- Неадитивно: То је мера која се не може додати ни у једну димензију.
- Полуадитив: То је мера која се може додати у неколико димензија.
79) Шта је збирна табела?
Обједињена табела садржи обједињене податке који се могу израчунати помоћу функција као што су: 1) Просек 2) МАКС, 3) Бројање, 4) СУМ, 5) СУМ и 6) МИН.
80) Шта је потврђена димензија?
Прилагођена димензија је димензија која је дизајнирана на начин који се може користити у многим табелама чињеница у разним областима складишта података.
81) Наведите врсте хијерархија у моделирању података
Постоје две врсте хијерархија: 1) хијерархије засноване на нивоу и 2) хијерархије родитеља и детета.
82) Која је разлика између дата марта и складишта података?
Дата март | Складиште података |
Дата март се фокусира на једно предметно подручје пословања. | Складиште података усредсређено је на више области пословања. |
Користи се за доношење тактичких одлука за раст пословања. | Помаже власницима предузећа да донесу стратешку одлуку |
Дата март следи модел одоздо према горе | Складиште података следи модел одозго надоле |
Извор података долази из једног извора података | Извор података потиче из више хетерогених извора података. |
83) Шта је КСМЛА?
КСМЛА је КСМЛ анализа која се сматра стандардом за приступ подацима у мрежној аналитичкој обради (ОЛАП).
84) Објасните димензију смећа
Нежељена димензија помаже у чувању података. Користи се када податке није правилно чувати у шеми.
85) Објаснити ланчану репликацију података
Ситуација када секундарни чвор бира циљ помоћу пинг времена или када је најближи чвор секундарни, назива се ланчана репликација података.
86) Објасните виртуелно складиштење података
Виртуелно складиште података даје збирни приказ довршених података. Виртуелно складиште података нема историјске податке. Сматра се логичним моделом података који има метаподатке.
87) Објасните снимак складишта података
Снапсхот је комплетна визуелизација података у тренутку када започиње процес издвајања података.
88) Шта је двосмерни екстракт?
Способност система да издваја, чисти и преноси податке у два правца назива се усмереним екстрактом.