”Tid” utgör en kritisk aspekt vid insamling av information. Inom tidsanalys spelar tiden en central roll i datamaterialet.
Vad innebär tidsrelaterad data?
Tidsrelaterad data syftar på en serie datapunkter som är strukturerade i kronologisk ordning. Denna ordning skapar ett beroende mellan olika observationer. Tidsbaserad data är allmänt förekommande i den nuvarande datadrivna miljön. Då alla händelser är beroende av tidens gång, interagerar vi kontinuerligt med olika typer av tidsrelaterad information.
Tidsrelaterad data genereras ofta med regelbundna tidsintervall, vilket betecknas som vanlig tidsrelaterad data. Det är dock inte nödvändigt att data inom en sådan serie genereras med jämna mellanrum. Oregelbunden tidsrelaterad data, där datapunkter följer en temporärt ojämn sekvens, är ett exempel på detta. Det betyder att mätningar inte alltid sker med exakt samma mellanrum. Data kan däremot skapas med enskilda tidsintervall eller i sekvenser. Uttag eller insättningar på bankkonton är exempel på oregelbunden tidsrelaterad data.
Tekniskt sett förändras en eller flera variabler i en tidsrelaterad serie under en given tidsperiod. Om endast en variabel ändras över tid, talar man om en envärdes tidsrelaterad serie. Exempelvis kan en sensor mäta temperaturen i ett rum varje sekund. Här skapas bara ett enkeldimensionellt temperaturvärde vid varje mättillfälle. Om fler än en variabel förändras med tiden, kallas det istället en flervärdes tidsrelaterad serie. Inom banksektorn kan flervärdes tidsrelaterade serier användas för att förstå hur policyförändringar av en variabel, som styrräntan, kan påverka andra variabler (t.ex. företagsbankers låneutbetalningar).
Tidsrelaterad data används inom många discipliner, från finans, geologi, meteorologi och tillverkning till datateknik, IoT, fysik och samhällsvetenskap. Den används för att följa väderförändringar, födelsetal, dödlighet, marknadssvängningar, nätverksprestanda och mycket annat. Några av de huvudsakliga användningsområdena är övervakning, prognoser och upptäckt av avvikelser. Tidsrelaterade prognoser är till exempel avgörande för att bedöma populariteten hos olika databashanteringssystem. Illustrationen nedan visar den ökande populariteten hos DBMS under åren (2019–2021) i en tidsrelaterad graf.
https://www.influxdata.com/time-series-database/
Viktiga komponenter i tidsrelaterad data
De faktorer som påverkar värdena i en tidsrelaterad observation betraktas som dess nyckelkomponenter. De tre huvudkategorierna av komponenter är:
- Trend, eller långsiktiga rörelser
- Kortvariga rörelser
- Säsongsvariationer
- Cykliska variationer
- Slumpmässiga eller oregelbundna rörelser
Trend
En tendens för data att öka eller minska över en längre tidsperiod betecknas som en trend eller en långsiktig komponent. Det är viktigt att notera att upp- eller nedåtgående rörelser inte behöver ske i samma riktning under en given period.
Trender kan antingen stiga, sjunka eller hålla sig stabila över olika tidsperioder. Den övergripande trenden ska dock alltid motsvara ett stigande, sjunkande eller stabilt mönster. Denna typ av rörelsemönster kan ses i exempel som jordbruksproduktivitet, dödlighet, tillverkade enheter, antal fabriker osv.
Linjär och icke-linjär trend
Att plotta tidsrelaterade värden mot tid i en graf avslöjar trendtypen baserat på hur datan samlas. Om datan samlas mer eller mindre runt en rät linje kallas trenden för en linjär trend. Annars indikerar datamönstret en icke-linjär trend eftersom förändringen mellan två variabler inte är stabil eller konstant. Sådana trender kallas även kurvlinjära korrelationer.
Kortvariga rörelser
I en tidsrelaterad serie tenderar dessa komponenter att återkomma med jämna mellanrum. De har korta, oregelbundna intensiva perioder och påverkar de variabler som studeras. De två underkategorierna för kortvariga rörelser är:
Säsongsvariationer
Dessa variationer sker regelbundet och periodiskt inom en period som är kortare än ett år. De tenderar att ha ett liknande eller nästan identiskt mönster under en 12-månadersperiod. Sådana variationer blir en del av en tidsrelaterad serie om datan registreras regelbundet, dvs varje timme, dag, vecka, månad eller kvartal.
Säsongsvariationer kan vara konstgjorda eller naturligt förekommande. Olika årstider eller klimatförhållanden spelar en viktig roll i dessa variationer. Till exempel är växtodling helt beroende av säsonger. På samma sätt beror efterfrågan på paraplyer eller regnkläder på regnperioden, medan försäljningen av kylare och luftkonditioneringsapparater toppar under sommarmånaderna.
Människoskapade konventioner inkluderar festivaler, högtider och tillfällen som bröllop. Sådana kortvariga händelser återkommer varje år.
Cykliska variationer
Tidsrelaterade variationer som tenderar att ske under en period som är längre än ett år kallas cykliska variationer. Inom ett företag betraktas en hel period som ”affärscykeln”. Toppar eller dalar i affärsresultat beror på olika faktorer som ekonomisk struktur, företagsledning och andra samverkande faktorer. Dessa cykliska affärsvariationer kan vara regelbundna, men inte periodiska. I allmänhet går företag igenom en cyklisk process i fyra faser som innefattar välstånd, nedgång, depression och återhämtning.
Sådana cykliska variationer är en integrerad del av ett tidsrelaterat mönster, eftersom affärsutveckling är starkt beroende av de skapade ”sekventiella datapunkterna”.
Slumpmässiga eller oregelbundna rörelser
Slumpmässiga komponenter leder till betydande variationer i den variabel som observeras. Dessa är rent oregelbundna fluktuationer utan något bestämt mönster. Påverkande faktorer är oförutsägbara och slumpmässiga till sin natur – till exempel jordbävningar, översvämningar, hungersnöd och andra katastrofer.
Slumpmässiga händelser som beskrivits ovan analyseras med hjälp av tidsrelaterad källdata för att bättre hantera potentiella verkliga scenarier som kan inträffa i framtiden.
Typer av tidsrelaterad data
Tidsrelaterad data kan delas in i fyra typer: deterministisk, icke-deterministisk, stationär och icke-stationär. Låt oss titta närmare på varje typ.
#1. Deterministisk tidsrelaterad data
En deterministisk tidsrelaterad serie kan beskrivas med ett analytiskt uttryck. Det involverar inga slumpmässiga eller sannolikhetsmässiga aspekter. Matematiskt kan den uttryckas exakt för alla tidsintervall med hjälp av en Taylor-serieutveckling. Detta är möjligt om alla derivator är kända vid en given tidpunkt. Dessa derivator anger exakt det förflutna och framtiden vid den tidpunkten. Om alla villkor uppfylls är det möjligt att exakt förutse dess framtida beteende och analysera hur den betedde sig tidigare.
#2. Icke-deterministisk tidsrelaterad data
En icke-deterministisk tidsrelaterad serie har en slumpmässig aspekt som hindrar dess precisa beskrivning. Därför är analytiska uttryck inte tillräckligt effektiva lösningar för att beskriva en sådan tidsrelaterad serie. En tidsrelaterad serie kan vara icke-deterministisk av följande skäl:
- Den information som krävs för att beskriva den finns inte i sin helhet. Även om datan i princip kan finnas, kan den inte behandlas som exakt kvantifierbar.
- Datagenereringsprocessen är slumpmässig till sin natur.
På grund av den slumpmässiga faktorn följer den icke-deterministiska tidsrelaterade serien sannolikhetslagar. Därför behandlas data statistiskt – vilket innebär att data definieras av sannolikhetsfördelningar och medelvärden av olika former. Detta inkluderar medelvärden och spridningsmått, dvs varianser.
#3. Stationär tidsrelaterad data
I en stationär tidsrelaterad serie beror de statistiska egenskaperna, såsom medelvärde, varians och andra, inte på tidsaspekten. En stationär tidsrelaterad serie är enklare att förutse eftersom man med säkerhet kan konstatera att dess statistiska egenskaper kommer att förbli desamma som de har observerats tidigare. Därför bygger olika statistiska prognosmetoder på argumentet att den tidsrelaterade serien är nästan stationär. Detta innebär att tidsrelaterade serier kan betraktas som stationära i approximation genom att använda enkla matematiska transformationer.
#4. Icke-stationär tidsrelaterad data
I en icke-stationär serie varierar de statistiska egenskaperna med tiden. Därför faller tidsrelaterade serier med trender eller säsongsvariationer in under den icke-stationära kategorin, eftersom trenden och säsongsvariationen kan påverka värdet av den tidsrelaterade serien vid olika tidsintervall. Icke-stationära tidsrelaterade serier beskriver oförutsägbar data, vilket gör det svårt att modellera eller prognostisera.
Tidsrelaterad analys och prognoser
Tidsrelaterad analys och prognoser är praktiska verktyg för att observera, analysera och studera utvecklingen och dynamiken hos viktiga processer och objekt av olika slag. Låt oss utforska dessa mer ingående.
Tidsrelaterad analys
Tidsrelaterad analys definieras som en process för att analysera data som samlas in under en tidsperiod. Här registrerar dataanalytiker information med konstanta intervall under en bestämd tid. Datainsamlingsfrekvensen, dvs tidsintervallet, kan variera från sekunder till år.
Tidsrelaterad data beskriver de undersökta variablerna, eftersom den ger en detaljerad analys av det fluktuerande mönstret över en specifik tidsperiod. De parametrar som krävs för analys kan variera mellan olika områden och discipliner. Några exempel är:
- Vetenskapliga instrument – Data registreras dagligen
- Kommersiell webbplats – Kundbesök per dag
- Börs – Aktievärden per vecka
- Säsong – Regniga dagar per år
För att säkerställa konsekvens och tillförlitlighet baseras tidsrelaterad analys på stora mängder datapunkter. En lämplig urvalsstorlek är en tydlig representation av en upptäckt trends eller ett mönsters äkthet.
Tidsrelaterad analys är även lämplig för att förutsäga framtida händelser baserat på tidigare registrerad data.
Tidsrelaterade prognoser
Tidsrelaterad analys gör det möjligt för organisationer att identifiera grundorsaken till fluktuationer i trender över tid. Med data i handen kan företag sedan studera och forska vidare för att bättre förstå hur man hanterar okända trender och förutser kommande händelser. Företag använder i allmänhet datavisualiseringstekniker för att identifiera sådana avvikelser i data.
Tidsrelaterade prognoser kretsar kring två viktiga faktorer:
- Att förutsäga framtida händelser baserat på tidigare databeteende.
- Att anta att kommande trender kommer att ha likheter med tidigare datamönster.
Inom prognoser är det primära målet att förutsäga hur datapunkterna kommer att fortsätta att vara desamma eller variera i framtiden. Här är några exempel från olika branscher för att bättre förstå nyanserna i tidsrelaterad analys och prognoser:
- Aktiemarknad – Förutsäga den dagliga stängningskursen.
- Försäljning – Förutsäga produktförsäljning för en butik varje dag.
- Prissättning – Förutsäga det genomsnittliga bränslepriset varje dag.
Några av de vanligaste statistiska metoderna som används för tidsrelaterade prognoser är enkelt glidande medelvärde (SMA), exponentiell utjämning (SES), autoregressivt integrerat glidande medelvärde (ARIMA) och neurala nätverk (NN).
Tidsrelaterad data i molnet
För att kunna dra nytta av tidsrelaterad data måste företag kunna lagra och snabbt söka efter data. Företag inom kapitalmarknaden är beroende av stora mängder historisk och strömmande data för att använda dataanalys i realtid och fatta viktiga affärsbeslut. Detta kan innebära att förutsäga sårbarheter i aktiekurser, beräkna nettokapitalkrav eller prognostisera valutakurser. För att ge flexibilitet och behandla data smidigt väljer många företag att flytta sina tidsrelaterade databaser till molnet.
Genom att flytta tidsrelaterade databaser till molnet kan organisationer få tillgång till obegränsade resurser på begäran. Det gör att företag kan använda hundratals kärnor för att utföra sina uppgifter, vilket maximerar nätverkets genomströmning utan fördröjningsproblem.
Tidsrelaterade databaser i molninfrastrukturen är lämpliga för datorintensiva arbetsbelastningar. Detta inkluderar att utföra riskberäkningar som svar på marknadstrender i realtid. Finansiella företag kan slippa datacentrets kostnader och fokusera på att använda resurser för att förbättra produktiviteten i sina arbetsflöden.
Molnleverantörer som AWS tillhandahåller Amazon Timestream, en tidsrelaterad databastjänst som gör det enkelt att ladda, lagra och analysera tidsrelaterad data. De erbjuder lagring för att hantera transaktionsintensiva arbetsbelastningar, analysverktyg i realtid och dataströmningsfunktioner för att visa händelser när de inträffar.
Därför förstärker och skalar molninfrastrukturen fördelarna med tidsrelaterad data.
Tillämpningar av tidsrelaterad data
Tidsrelaterade modeller har två syften:
- Att förstå de bakomliggande faktorerna som skapat ett visst datamönster.
- Att, baserat på analysen, anpassa en modell för prognoser och övervakning.
Låt oss titta på några av tillämpningarna för tidsrelaterad data.
#1. Tidsrelaterad data inom finans och affärer
Alla finansiella, affärsmässiga och investeringsbeslut fattas utifrån rådande marknadstrender och efterfrågeprognoser. Tidsrelaterad data används för att förklara, korrelera och förutsäga den dynamiska finansmarknaden. Finansiella experter kan granska den finansiella informationen för att skapa prognoser som hjälper till att minska risker, stabilisera prissättningen och handeln.
Tidsrelaterad analys spelar en viktig roll i finansiell analys. Den används i ränteförutsägelser, för att förutsäga volatiliteten på aktiemarknaderna och mycket mer. Affärsintressenter och beslutsfattare kan fatta välgrundade beslut om tillverkning, inköp, resursallokering och optimera sin affärsverksamhet.
Denna analys används effektivt inom investeringssektorn för att övervaka värdepappersräntor och deras fluktuationer över tid. Värdepapperspriset kan också observeras på kort sikt (dvs. registrera data per timme eller dag) eller på lång sikt (dvs. observationer som sträcker sig över månader eller år). Tidsrelaterad analys är ett användbart verktyg för att följa hur ett värdepapper, en tillgång eller en ekonomisk variabel presterar över en längre tidsperiod.
#2. Tidsrelaterad data inom medicin
Sjukvården utvecklas snabbt till ett datadrivet område. Utöver finansiell och affärsmässig analys använder den medicinska sektorn i stor utsträckning tidsrelaterad analys.
Tänk dig ett scenario som kräver en kombination av tidsrelaterad data, medicinskt anpassade metoder och datautvinningstekniker vid behandling av cancerpatienter. Ett sådant hybridramverk kan användas för att utnyttja funktionsextrahering från insamlad tidsrelaterad data (dvs. patientens röntgenbilder) för att följa patientens framsteg och svar på behandlingar som tillhandahålls av vårdpersonalen.
Inom hälso- och sjukvården är det avgörande att dra slutsatser från ständigt föränderlig tidsrelaterad data. Dessutom kräver avancerad medicinsk praxis att patientjournaler kopplas samman över tid för att ge bättre insyn i patientens hälsa. Patientens hälsoparametrar måste registreras exakt med jämna mellanrum för att ge en tydligare bild av patientens hälsotillstånd.
Med avancerade medicinska instrument har tidsrelaterad analys etablerat sig inom hälso- och sjukvårdssektorn. Tänk på följande exempel:
- EKG-enheter: Enheter som uppfunnits för att övervaka hjärtfunktionen genom att registrera hjärtats elektriska impulser.
- EEG-enheter: Enheter som används för att kvantifiera den elektriska aktiviteten i hjärnan.
Sådana enheter har gjort det möjligt för läkare att utföra tidsrelaterad analys för snabbare, effektivare och mer korrekt medicinsk diagnostik.
Dessutom kan människor, med hjälp av IoT-enheter som bärbara sensorer och medicinska enheter, nu göra regelbundna mätningar av sina hälsoparametrar över tid med minimala ansträngningar. Detta leder till en konsekvent datainsamling av tidsberoende medicinsk data för både sjuka och friska individer.
#3. Tidsrelaterad data inom astronomi
Astronomi och astrofysik är två moderna discipliner där tidsrelaterad data används i stor utsträckning.
I grunden handlar astronomi om att kartlägga himlakroppars banor och utföra exakta mätningar för att bättre förstå universum utanför jordens atmosfär. På grund av detta krav är astronomer skickliga på att hantera tidsrelaterad data samtidigt som de kalibrerar och konfigurerar komplexa instrument och studerar astronomiska objekt av intresse.
Tidsrelaterad data har länge förknippats med astronomiområdet. Redan 800 f.Kr. samlades tidsrelaterad data om solfläckar in regelbundet. Sedan dess har tidsrelaterad analys använts för att:
- Upptäcka avlägsna stjärnor baserat på deras avstånd
- Observera kosmiska händelser som supernovor för att bättre förstå ursprunget till vårt universum.
Tidsrelaterad data relaterar här till våglängderna och intensiteten av ljus som avges av stjärnor, himlakroppar eller andra föremål. Astronomer övervakar ständigt denna data för att upptäcka kosmiska händelser i realtid när de inträffar.
På senare tid har forskningsområden som astroinformatik och astrostatistik vuxit fram. Dessa områden blandar olika discipliner som datautvinning, maskininlärning, beräkningsintelligens och statistik. Inom dessa nya forskningsområden är tidsrelaterad datas roll att snabbt och effektivt upptäcka och klassificera astronomiska objekt.
#4. Tidsrelaterad data inom väderprognoser
Aristoteles studerade vädermönster utförligt för att bättre förstå de orsaker och effekter som observerades vid väderförändringar under antiken. Allt eftersom tiden gick började forskare registrera väderrelaterad information med instrument som ”barometer” för att beräkna atmosfäriska variabler. Datan samlades in regelbundet och förvarades på olika platser.
Med tiden började väderprognoser dyka upp i tidningarna. I dagens moderna samhälle finns allestädes närvarande väderprognosstationer installerade i olika geografiska områden runt om i världen för att samla in exakt väderdata.
Dessa stationer har avancerade funktionella enheter som är sammankopplade för att samla in och korrelera väderdata från olika platser. Korrelerad data används för att förutsäga väderförhållanden vid olika tidpunkter beroende på behov.
#5. Tidsrelaterad data inom affärsutveckling
Tidsrelaterad data gör det möjligt för företag att fatta affärsbeslut. Detta uppnås genom att analysera tidigare data för att förutsäga framtida händelser och ge information om möjliga möjligheter. Det tidigare datamönstret används för att analysera följande parametrar:
- Affärstillväxt: För att utvärdera det övergripande ekonomiska och affärsmässiga resultatet och mäta tillväxt är tidsrelaterad data det mest lämpliga och pålitliga verktyget.
- Trendbedömning: Olika tidsrelaterade metoder kan användas för att bedöma uppkommande trender. Tänk till exempel på att dessa metoder analyserar dataobservationer över en tidsperiod för att visa en ökning eller minskning av försäljningen av en viss elektronisk enhet.
- Identifiera säsongsmönster: De registrerade datapunkterna kan visa fluktuationer och säsongsmönster som kan underlätta prognoser. Den erhållna informationen spelar en nyckelroll på marknader där produktpriserna varierar säsongsmässigt. Sådan data kan hjälpa företag med bättre produktplanering och utveckling.
Sammanfattning 👨🏫
Sammanfattningsvis kan tidsrelaterad data ses som de egenskaper som komplexa datapunkter har när de samlats in under en konstant tidsperiod. Tidsrelaterad analys, modellering och prognoser har blivit en integrerad del av vår vardag med framväxten av IoT-prylar, smarta hushållsapparater och bärbara enheter. Dessutom används tidsrelaterad data inom olika områden, inklusive hälso- och sjukvård, astrofysik, ekonomi, teknik, affärer och många fler.