Im Bereich Data Mining kommen, meist in Kombination mit der Datumseingrenzung, weitere Funktionen zum Tragen. Eine davon ist die Identifizierung wichtiger Threads, die sich durch eine hohe Reichweite auszeichnen. Grundvoraussetzung einer solchen Suchanfrage ist die Erkennung von Threads und Postings in Foren.
Eine fortschrittliche Social-Media-Technologie kann auch in der Lage sein, richtig zu bestimmen, welche Postings eines Forums welchem Thread zugehörig sind.
Ist eine entsprechende Auswertung der Foren erfolgt, sind Data-Mining-Abfragen möglich, die zu gehaltvollen Ergebnissen führen. Ein Researcher kann sich beispielsweise die Beiträge der letzten 14 Tage zu einem bestimmten Begriff anzeigen lassen und zusätzlich nach den Autoren filtern, die innerhalb dieses Zeitraums sehr aktiv waren.
Häufig stellt es sich so dar, dass Threads, die viele verschiedene Autoren zur Diskussion motiviert haben, eine höhere Reichweite haben als Threads, in denen sich nur wenige Autoren unterhalten. Solche Kenntnisse benötigen Abfragen, mit denen sich Trends auf einfachem Wege erkennen lassen.
So funktioniert ein Trend-Research
Ein Beispiel wäre eine Suche nach dem Thema „iPhone“. Die Ergebnisliste wird nach Threads gefiltert, die zum Beispiel ab einem bestimmten Zeitpunkt entstanden sind (z. B. 1. Juli 2023), um zu alte Beiträge zu vermeiden. Das letzte Posting muss allerdings nach dem 14. Juli 2023 erstellt worden sein, um zu gewährleisten, dass die Diskussion nicht etwa nach wenigen Tagen endete, sondern sich mindestens eine Woche fortgesetzt hat.
m nur hochfrequentierte Themen angezeigt zu bekommen, kann man beispielsweise die Anzahl der Postings auf mindestens 50 stellen. Weiterhin kann man dan ein Filter auf „Mindestautoren“ setzen, der verhindert, dass Threads angezeigt werden, in denen sich nur wenige Nutzer untereinander austauschen und die das Interesse der Community nicht wecken konnten.
Als Ergebnis sind ausschließlich Treffer zu erwarten, die durch ihre Reichweite für das Unternehmen von erhöhter Relevanz sind.
Anfragen wie diese werden häufig an große Datenbanken gestellt, in denen mehr als 200 Millionen Postings gespeichert sind. Durch Filter wie diese wird aus der zunächst nicht zu bewältigenden Menge von Treffern eine kleine Anzahl relevanter Treffer ausgewählt.
Im obigen „iPhone“-Beispiel würden von 200 Millionen Postings letztlich nur 26 Threads angezeigt. Zwar dauern derartig komplexe Anfragen bis zu mehrere Minuten, das Ergebnis sind jedoch hochfrequentierte Threads mit den höchsten Reichweiten der letzten 7 Tage. Eine manuelle Auswertung vergleichbarer Datenmengen hätte Monate oder gar Jahre in Anspruch genommen.