Topp Store Datateknologier som du Trenger å vite

Store Datateknologier, Buzz-ordet som du får høre mye i de siste dagene. I denne artikkelen skal vi diskutere de banebrytende teknologiene som gjorde At Big Data spredte sine grener for å nå større høyder.

  • Hva Er Big Data Teknologi?
  • Typer Av Stor Datateknologi
  • Topp Store Datateknologier
  • Nye Store Datateknologier

Hva Er Stor Datateknologi?

Big Data-Teknologi kan defineres Som Et Programvareverktøy som Er designet For Å Analysere, Behandle og Trekke ut informasjonen fra et ekstremt komplekst og stort datasett som Den Tradisjonelle Databehandlingsprogramvaren aldri kunne håndtere.

 Big-Data-Technologies-bilde-1

Vi trenger Store Databehandlingsteknologier for Å Analysere denne enorme Mengden Sanntidsdata og komme Med Konklusjoner og Spådommer for å redusere risikoen i fremtiden.

la Oss nå se På Kategoriene der De Store Datateknologiene er klassifisert:

Typer Big Data Teknologier:

Big Data Teknologi er hovedsakelig klassifisert i to typer:

  1. Operasjonelle Big Data Teknologier
  2. Analytiske Big Data Teknologier

Big-data-teknologier-typer

For Det Første Handler De Operative Big Data om de normale daglige dataene vi genererer. Dette kan være Online Transaksjoner, Sosiale Medier, eller data fra En Bestemt Organisasjon etc. Du kan til og med vurdere dette for å være En Slags Rådata som brukes til å mate De Analytiske Store Datateknologiene.

Noen eksempler På Operasjonelle Big Data Teknologier er som følger:

Operational-Big-Data-Technologies

  • Online billettbestillinger, som inkluderer Togbilletter, Flybilletter, kinobilletter etc.
  • online shopping som Er Din Amazon, Flipkart, Walmart, Snap deal og mange flere.
  • Data fra sosiale medier som Facebook, Instagram, hva er app og mye mer.
  • de ansattes detaljer Om Ethvert Multinasjonalt Selskap.

så, med dette la oss gå inn I Analytiske Store Datateknologier.

Analytisk Big Data er som den avanserte versjonen Av Big Data Teknologier. Det er litt komplisert enn De Operative Big Data. Kort Sagt, Analytiske big data er hvor den faktiske ytelsesdelen kommer inn i bildet, og de avgjørende sanntidsbeslutningene tas ved å analysere De Operative Big Data.

Få eksempler På Analytiske Big Data Teknologier er som følger:

Big-Data-Teknologier-bilde-4

  • Aksjemarkedsføring
  • Utføre Romoppdragene der hver eneste bit av informasjon er avgjørende.
  • Informasjon Om Værmelding.
  • Medisinske felt hvor en bestemt pasientens helsetilstand kan overvåkes.

La Oss se på de beste Store Datateknologiene som brukes I IT-Bransjen.

Topp Big Data Teknologier

Topp big data teknologier er delt inn i 4 felt som er klassifisert som følger:

  • Datalagring
  • Data Mining
  • Dataanalyse
  • Datavisualisering

Big-Data-Teknologier-bilde-4

la Oss nå håndtere teknologiene som faller under hver av disse kategoriene med sine fakta og evner, sammen med selskapene som bruker dem.

La Oss komme i gang Med Store Datateknologier i Datalagring.

Datalagring

Hadoop

 big-data-technologies-storage-bilde-1

Hadoop Framework er designet for å lagre og behandle data I Et Distribuert Databehandlingsmiljø med vare maskinvare med en enkel programmeringsmodell. Den Kan Lagre og Analysere dataene som finnes i forskjellige maskiner Med Høye Hastigheter og Lave Kostnader.

          • Utviklet Av: Apache Software Foundation i år 2011 10 Desember.
          • Skrevet i: JAVA
          • Nåværende stabil versjon: Hadoop 3.11

Selskaper Som Bruker Hadoop:big-data-technologies-hadoop

MongoDB

bigdata-technologies-3

Nosql Dokumentdatabaser som MongoDB, tilbyr et direkte alternativ til det stive skjemaet som brukes I Relasjonsdatabaser. Dette gjør At MongoDB kan tilby Fleksibilitet mens du håndterer et bredt utvalg Av Datatyper i store mengder og På Tvers Av Distribuerte Arkitekturer.

          • Utviklet Av: MongoDB i år 2009 11 Februar
          • Skrevet I: C++, Go, JavaScript,Python
          • Nåværende stabil versjon: MongoDB 4.0.10

Selskaper Som Bruker MongoDB:

big-data-technologies-mongodb

Rainstor

 big-data-technologies-storage-picture-3 RainStor er et programvareselskap som utviklet Et Databasestyringssystem med samme navn designet for Å Administrere Og Analysere Store Data for store bedrifter. Den bruker Deduplisering Teknikker for å organisere prosessen med å lagre store mengder data for referanse.

          • Utviklet Av: RainStor Software company i år 2004.
          • Fungerer som: SQL
          • Nåværende stabil versjon: RainStor 5.5

Selskaper Som Bruker RainStor:

big-data-technologies-rainstor

Hunk

bigdata-technologies-5

Hunk lar deg få tilgang til data i eksterne Hadoop-Klynger gjennom virtuelle indekser, og lar Deg bruke Splunk Search Processing Language for å analysere dataene dine. Med Hunk Kan du Rapportere og Visualisere store mengder Fra Hadoop-og NoSQL-datakildene dine.

          • Utviklet Av: Splunk INC i år 2013.
          • Skrevet i: JAVA
          • Gjeldende stabil versjon: Splunk Hunk 6.2

Nå, la oss flytte Inn I Store Datateknologier som brukes I Data Mining.

Data Mining

Presto

bigdata-technologies-1

Presto Er en Åpen kildekode Distribuert SQL Spørring Motor for å kjøre Interaktive Analytiske Spørringer mot datakilder av alle størrelser fra Gigabyte Til Petabyte. Presto tillater spørring av data i Hive, Cassandra, Relasjonsdatabaser og Proprietære Datalager.

          • Utviklet Av: Apache Foundation i år 2013.
          • Skrevet i: JAVA
          • Gjeldende stabil versjon: Presto 0.22

Selskaper Som Bruker Presto:

big-data-technologies-presto

Rapid Miner

 big-data-technologies-storage-bilde-6

RapidMiner Er En Sentralisert løsning som har en svært kraftig Og robust Grafisk Brukergrensesnitt som lar brukerne Opprette, Levere og vedlikeholde Prediktiv Analyse. Det gjør det mulig å skape Svært Avanserte Arbeidsflyter, Skriptstøtte på flere språk.

          • Utviklet av: RapidMiner i året 2001
          • Skrevet i: JAVA
          • Gjeldende stabil versjon: RapidMiner 9.2

Selskaper Som Bruker RapidMiner:

big-data-technologies-rapidminer

Elasticsearch

 big-data-technologies-storage-bilde-7

Elasticsearch er En Søkemotor basert På Lucene Biblioteket. Det gir En Distribuert, MultiTenant-stand, Fulltekstsøkemotor MED ET HTTP Webgrensesnitt og Skjemafrie json-dokumenter.

          • Utviklet av: Elastisk NV i året 2012.
          • Skrevet i: JAVA
          • Nåværende stabil versjon: ElasticSearch 7.1

Selskaper Som Bruker Elasticsearch:

big-data-technologies-elasticsearch

Med Dette kan vi nå flytte inn I Store Datateknologier som brukes I Dataanalyse.

Dataanalyse

Kafka

bigdata-technologies-6

Apache Kafka Er En Distribuert Streaming plattform. En streaming plattform har Tre Viktige Funksjoner som er som følger:

          • Utgiver
          • Abonnent
          • Forbruker

dette ligner På En Meldingskø eller Et Enterprise-Meldingssystem.

  • Utviklet av: Apache Software Foundation i år 2011
  • Skrevet i: Scala, JAVA
  • Gjeldende stabil versjon: Apache Kafka 2.2.0

Selskaper Som Bruker Kafka:

big-data-technologies-kafka

Splunk

bigdata-technologies-7Splunk fanger opp, Indekserer Og korrelerer sanntidsdata i Et Søkbart Depot hvor Det kan generere Grafer, Rapporter, Varsler, Oversikter og Datavisualiseringer. Den brukes også Til Applikasjonsadministrasjon, Sikkerhet og Samsvar, Samt Forretnings-Og Webanalyse.

          • Utviklet av: Splunk INC i år 2014 6 Mai
          • Skrevet i: AJAX, C++, Python, XML
          • Gjeldende stabil versjon: Splunk 7.3

Selskaper Som Bruker Splunk:

big-data-technologies-splunk

KNIME

bigdata-technologies-8KNIME tillater brukere å visuelt lage Datastrømmer, Selektivt utføre noen Eller Alle Analysetrinn, Og Inspisere Resultatene, Modeller og Interaktive visninger. KNIME er skrevet I Java og basert På Eclipse og benytter Seg av Utvidelsesmekanismen for å legge Til Plugins som gir Ekstra Funksjonalitet.

          • Utviklet AV: KNIME i året 2008
          • Skrevet i: JAVA
          • Nåværende stabil versjon: KNIME 3.7.2

Selskaper Som Bruker KNIME:

big-data-technologies-knimeSpark

bigdata-technologies-9

Spark gir Minneberegningsmuligheter for å levere Hastighet, En Generalisert Utførelsesmodell for å støtte et bredt utvalg av applikasjoner, Og Java -, Scala-og Python-Apier for enkel utvikling.

          • Utviklet Av: Apache Software Foundation
          • Skrevet i: Java, Scala, Python, R
          • Gjeldende stabil versjon: Apache Spark 2.4.3

Selskaper Som Bruker Spark:

big-data-technologies-spark

R-Språk

bigdata-technologies-10

R Er Et Programmeringsspråk og fri programvare miljø for Statistisk Databehandling og Grafikk. R-språket er mye brukt blant Statistikere og Data Gruvearbeidere for å utvikle Statistisk Programvare og majorly I Dataanalyse.

          • Utviklet Av: R-Foundation i år 2000 29 Februar
          • Skrevet i: Fortran
          • Gjeldende stabil versjon: R-3.6.0

Selskaper Som Bruker R-Språk:

big-data-technologies-R

Blockchain

 big-data-technologies-storage-picture-13 BlockChain brukes i viktige funksjoner som betaling, escrow og tittel kan også redusere svindel, øke økonomisk personvern, øke transaksjoner og internasjonalisere markeder.

BlockChain kan brukes til å oppnå følgende i Et Bedriftsnettverk Miljø:

          • Delt Hovedbok: Her kan vi legge Til Distribuert system av poster over Et Bedriftsnettverk.
          • Smart Kontrakt: Forretningsvilkår er innebygd i transaksjonsdatabasen og Utføres med transaksjoner.
          • Personvern: Sikre riktig Synlighet, Transaksjoner Er Sikre, Autentiserte Og Verifiserbare
          • Konsensus: alle parter i Et Bedriftsnettverk godtar nettverksverifiserte transaksjoner.
  • Utviklet Av: Bitcoin
  • Skrevet i: JavaScript, C++, Python
  • Nåværende stabil versjon: Blockchain 4.0

Selskaper Som Bruker Blockchain:

big-data-technologies-blockchain

Med dette skal vi flytte Inn I Datavisualisering Store datateknologier

Datavisualisering

Tableau

bigdata-technologies-12

Tableau Er Et Kraftig Og Raskest voksende Datavisualiseringsverktøy som brukes i Business Intelligence-Bransjen. Dataanalyse er veldig rask Med Tableau Og Visualiseringer opprettet er i form Av Oversikter og Regneark.

          • Utviklet av: TableAU 2013 17 Mai
          • Skrevet i: JAVA, C++, Python, C
          • Gjeldende stabil versjon: TableAU 8.2

Companies Using Bergen:

big-data-technologies-tableau

Plotly

 big-data-technologies-storage-bilde-15

Hovedsakelig brukes til å lage grafer raskere og mer effektiv. API-biblioteker for Python, R, MATLAB, Node.Js, Julia, Og Arduino og EN REST API. Plotly kan også brukes til å style Interaktive Grafer med Jupyter notebook.

          • Utviklet av: Plotly i året 2012
          • Skrevet i: JavaScript
          • Gjeldende stabil versjon: Plotly 1.47.4

Selskaper Som Bruker Plotly:

big-data-technologies-plotly la oss nå diskutere De Fremvoksende Store Datateknologiene

Fremvoksende Store Datateknologier

TensorFlow

bigdata-technologies-11

TensorFlow har Et Omfattende, Fleksibelt Økosystem av verktøy, Biblioteker og Fellesskapsressurser som Lar Forskere presse det nyeste Innen Maskinlæring, og Utviklere kan enkelt bygge og distribuere Maskinlæringsdrevne applikasjoner.

          • Utviklet Av: Google Brain Team i år 2019
          • Skrevet i: Python, C++, CUDA
          • Nåværende stabil versjon: TensorFlow 2.0 beta

Selskaper Som Bruker TensorFlow:

big-data-technologies-tensorflow

Beam

 big-data-technologies-storage-bilde-17

Apache Beam gir Et Bærbart API-lag for å bygge sofistikerte Parallelle Databehandlingsrørledninger som kan utføres på tvers av Et mangfold Av Utførelsesmotorer eller Løpere.

          • Utviklet av: Apache Software Foundation i år 2016 15 juni
          • Skrevet i: JAVA, Python
          • Gjeldende stabil versjon: Apache Beam 0.1.0 inkubering.

Selskaper Som Bruker Beam:

big-data-technologies-beamDocker

bigdata-technologies-14

Docker Er et verktøy utviklet for å gjøre det enklere Å Opprette, Distribuere og Kjøre programmer ved Hjelp Av Beholdere. Beholdere tillater en utvikler Å Pakke opp et program med alle delene den trenger, For Eksempel Biblioteker og Andre Avhengigheter, og Sende alt ut som En Pakke.

          • Utviklet Av: Docker INC i år 2003 13 Mars.
          • Skrevet i: Gå
          • Gjeldende stabil versjon: Docker 18.09

Selskaper Som Bruker Docker:

big-data-technologies-docker

Airflow

 big-data-technologies-storage-picture-19 Apache Airflow Er En Arbeidsflyt Automatisering Og Planlegging System som kan brukes til å forfatter Og administrere Datasamlebånd. Airflow bruker arbeidsflyter laget Av Rettede Asykliske Grafer (DAGs) av oppgaver. Definere Arbeidsflyter i kode gir Enklere Vedlikehold, Testing og Versjonskontroll.

          • Utviklet Av: Apache Software Foundation 15. Mai 2019
          • Skrevet i: Python
          • Nåværende stabil versjon: Apache AirFlow 1.10.3

Selskaper Som Bruker AirFlow:

airflow

Kubernetes

bigdata-technologies-13 Kubernetes Er Et Leverandør-Agnostisk Cluster – Og Containerhåndteringsverktøy, Som Ble Åpnet Av Google i 2014. Det gir en plattform For Automatisering, Distribusjon, Skalering og Drift Av Applikasjonsbeholdere på Tvers Av Klynger Av Verter.

          • Utviklet av: Cloud Native Computing Foundation i år 2015 21 juli
          • Skrevet i: Go
          • Nåværende stabil versjon: Kubernetes 1.14

Selskaper Som Bruker Kubernetes:

big-data-teknologier-kubernetes-1

Med dette kommer vi til en slutt på denne artikkelen. Jeg håper jeg har kastet litt lys på din kunnskap Om Big Data og Dets Teknologier.

nå som Du har forstått Big data Og Dets Teknologier, sjekk Ut Hadoop training Av Edureka, et pålitelig online læringsselskap med et nettverk av mer enn 250 000 fornøyde elever spredt over hele verden. Edureka Big Data Hadoop Certification Training course hjelper elevene til å bli ekspert på HDFS, Garn, MapReduce, Pig, Hive, HBase, Oozie, Flume og Sqoop ved hjelp av sanntids brukstilfeller På Detaljhandel, Sosiale Medier, Luftfart, Turisme, Finansdomene.