I enighet med talesättet bättre sent än aldrig har jag börjat samla in affärshistorik för de fyra stora nordiska aktiemarknaderna. För till skillnad från dagligt samplad prishistorik så är tickhistorik, eller för den delen all intradagshistorik mycket sällsynt och dyr att köpa. Så för den lilla kvantoperationen som inte är villig att spendera stora delar av årets vinst på historik så blir det till att bygga en egen databas. Själva insamlingen är ganska simpel och kräver inget arbete; en liten app skriven i C# startas automatiskt när datorns slås på och ligger för de mesta och sover i bakgrunden. När börserna stängt för dagen så börjar den att läsa in Nordnets hemsida och gå igenom tabellen som visar dagens affärer nod för nod och sparar det i en txt-fil. Jag har nu lite mer än två veckors historik som tar upp en plats på runt ~250Mb så ett år borde blir runt 6-7Gb - knappast något som kommer att kräva en extra hårddisk i framtiden. Problemet med att endast ha level 1-data är att det finns inget sätt att veta om man kunde fått priset som senaste affären gjordes på. Ännu bättre skulle det vara att spara level 2-data (hela orderboken vid varje tidpunkt) men jag saknar en leverantör där jag skulle kunna hämta det gratis.
Med historik från den 15/6 (exkluderat den 18 då min app buggade ur) till den 29/6 har jag ritat följande diagram med omsättningen för varje minut för alla aktier i Sverige, Norge, Danmark och Finland. Den svarta linjen är medelvärde för de senaste 60 minuterna. Som förväntat så är öppningen och stängningen stora minuter, runt lunchen vänder den nedåtgående trenden och omsättningen ökar hela eftermiddagen.
Något intressant med omsättningen är att den för varje minut är ganska förutsägbar baserat på de två föregående minuterna. Om omsättningen ökar en minut så finns det en sannolikhet på 64% att nästföljande minut har en lägre omsättning, och vice versa.
På samma sätt finns de en relation mellan förändringen i sekvensen av affärer. Om en affär sker till ett högre pris än föregående finns de en sannolikhet på 28% att nästa är lägre, 60% att nästa är på samma pris och 12% att det är högre. Omvänd så gäller för tick nedåt att 28% av nästföljande affärer sker högre, 60% oförändrat och 12% på samma. Anledningen till varför det ter sig så ligger förmodligen i alla de effekter som påverkar marknadens mikrostruktur som jag ännu inte har lärt mig. Då en tick uppåt förmodligen tar säljarnas bud så borde köpsidan bli större än säljsidan och obalansen borde trycka kursen uppåt, men tydligen är sambandet omvänt. Kanske ligger svaret i likviditetsgaranternas vinstmarginal.
Hursomhelst är min samling ännu alldeles för liten för att börja backtesta seriöst på, För det krävs minst över 18 månader, för även om antalet observationer kan bli ganska stor med högre frekvens så garanterar det inte att marknadsklimatet inte påverkar resultatet allt för mycket. Jag planerar även att spara ner pressmeddelande och telegram som kommit under perioden, men det verkar iallafall Avanza spara på i minst ett år så jag behöver nog inte hämta det så ofta. Det ska bli intressant att se om det finns någon alfa intradag som ännu inte sugits upp av "robothandlarna".
KvA