Tematyka seminarium obejmuje teorię i praktykę przetwarzania danych i reprezentacji wiedzy. Interesują nas wyzwania związane z przetwarzaniem danych, zapytań i metadanych (schematów, więzów, zależności, ontologii) - od projektowania i analizy abstrakcyjnych formalizmów aż po architekturę systemów i rozpraszanie obliczeń na dużych danych. Rozważamy różne rodzaje danych: nie tylko dane relacyjne, ale również semistrukturalne (XML, JSON), grafowe (RDF, LPG), obiektowe, tekstowe, temporalne, strumieniowe, aż po systemy informacji geograficznej (GIS).
Podejmujemy zarówno zagadnienia teoretyczne, wykorzystujące warsztat algorytmiki, kombinatoryki, logiki (np. teorii modeli skończonych) i teorii automatów, jak i praktyczne, opierające się na narzędziach inżynierii oprogramowania i wiedzy o systemach. Prace magisterskie powstające w ramach seminarium mogą badać rozstrzygalność i złożoność abstrakcyjnych problemów decyzyjnych, projektować algorytmy i heurystyki, implementować i testować istniejące rozwiązania teoretyczne, czy też analizować, porównywać i rozszerzać istniejące systemy.
Spotykamy się również i dyskutujemy z badaczami z innych dziedzin, którzy czasami dostarczają nam pomysłów na tematy prac magisterskich. Współpracowaliśmy już lub nadal współpracujemy z astronomami, chemikami, geografami. Jesteśmy nadal otwarci na inne obszary zastosowań.
Referaty seminaryjne są zwykle wygłaszane na podstawie wybranych prac z głównych międzynarodowych konferencji poświęconych bazom danych i reprezentacji wiedzy, takich jak VLDB, PODS, SIGMOD i KR.
Przykładowe zagadnienia:
- Data models, semantics, query languages
- Data provenance
- Databases for emerging hardware
- Distributed and parallel databases
- Graph data management, RDF, social networks, Semantic Web
- Knowledge discovery, clustering, data mining
- Machine learning for data management and vice versa
- Model theory, logics, algebras, computational complexity
- Ontology-based data access, data integration and exchange, metadata management
- Ontology formalisms and models, description logics
- Privacy, security, ethics
- Query processing and optimization
- Scientific databases
- Semi-structured data
- Small data, end-user programming
- Storage, indexing, and physical database design
- Streams, sensor networks, complex event processing
- Transaction processing
- Uncertainty, incompleteness, and inconsistency in data management
Organizatorzy
- dr hab. Filip Murlak, prof. ucz.
- dr hab. Jacek Sroka
- prof. dr hab. Krzysztof Stencel
- prof. dr hab. Jerzy Tyszkiewicz
Informacje
wtorki, 10:15 , sala: 4060Strona domowa
https://sites.google.com/view/sembdmimuw?pli=1&authuser=1Dziedziny badań
Lista referatów
-
9 czerwca 2026 11:15
Justyna Palikowska (MIMUW)
Wykrywanie anomalii w szeregach czasowych latencji
Projekt dotyczy wykrywania anomalii w szeregach czasowych latencji p99 w systemach rozproszonych. W ramach projektu przetestowałam metody wykrywania dwóch typów anomalii: krótkoterminowych regresji oraz długoterminowych trendów degradacji. Podczas referatu omówię specyfikację zbioru danych, zastosowane metody …
-
9 czerwca 2026 10:45
Piotr Głowacki (MIMUW)
Jakie praktyki korelują z jakością PRów tworzonych przez agentów AI? (What practices correlate with the quality of Agentic-PRs?)
Podczas referatu przedstawię założenia i wyniki mojego projektu badawczego, realizowanego w ramach konkursu MSR 2026 Mining Challenge odpowiadającego na pytanie: „jakie praktyki korelują z jakością Pull Requestów tworzonych przez agentów AI?". Zacznę od osadzenia tematu …
-
9 czerwca 2026 10:15
Gustaw Blachowski (MIMUW)
Database benchmarking and why it’s difficult (Database benchmarking and why it’s difficult)
W ramach referatu opiszę różne sposoby, na jakie próbowałem benchmarkować bazy danych na rożnych urządzeniach, oraz dlaczego mi się to nie udało.
-
2 czerwca 2026 11:15
Katarzyna Mielnik (MIMUW)
Implementation of of Scalable Algorithms for Aggregation Over Dominated Points on GPU (Implementation of of Scalable Algorithms for Aggregation Over Dominated Points on GPU)
W referacie przedstawię temat mojej pracy magisterskiej dotyczącej implementacji algorytmów agregacji na zdominowanych punktach na GPU. Omówię problem, który rozwiązują te algorytmy, oraz różnice między istniejącymi podejściami, w tym rozwiązaniem współtworzonym przez prof. Tyszkiewicza. Przedstawię …
-
2 czerwca 2026 10:45
Piotr Baranowski (MIMUW)
Replikacja sieci bezprzewodowej oparta na danych - w stronę inteligentnych cyfrowych bliźniaków
Podczas referatu opowiem o cyfrowych bliźniakach (Digital Twins) na przykładzie replikacji sieci bezprzewodowej. Przedstawię dotychczasowe podejścia z literatury oraz wyniki własnych eksperymentów.
-
2 czerwca 2026 10:15
Krzysztof Lembryk & Dominik Strąk (MIMUW)
Integrating rsonpath with PostgreSQL (Integrating rsonpath with PostgreSQL)
W ramach projektu zintegrowaliśmy rsonpath -- silnik zapytań JSONPath wykorzystujący SIMD -- z PostgreSQL jako rozszerzenie napisane w Rust przy użyciu pgrx, wraz z własnym operatorem i klasą operatorów GIN do indeksowania zapytań. Porównaliśmy wydajność …
-
26 maja 2026 11:00
Rem Karablin (MIMUW)
Implementacja i Analiza Algorytmu Entity Alignment
Projekt dotyczy problemu entity alignment, czyli rozpoznawania, które encje w różnych grafach wiedzy reprezentują ten sam obiekt świata rzeczywistego. Głównym celem jest analiza metod wykorzystujących strukturę grafu do określania podobieństwa między encjami i implementacja wybranego …
-
26 maja 2026 10:15
Ewa Kaluś (MIMUW)
Wsparcie dla walidacji dokumentów JSON w RSONPath
RSONPath (https://github.com/rsonquery/rsonpath) to silnik do szybkiego przetwarzania zapytań JSONPath dla dokumentów JSON, działający w modelu strumieniowym. W ramach referatu przedstawię walidator dokumentów JSON względem schematów JSON Schema, zbudowany jako rozszerzenie tego silnika. Omówię podstawy JSON …
-
19 maja 2026 11:00
Zuzanna Ossowska (MIMUW)
Mechanizm Orchestra w środowisku Contiki-NG
W ramach referatu opowiem o metodach przesyłania danych w sieciach Internetu Rzeczy (IoT). Współczesne standardy komunikacji skutecznie ograniczają zakłócenia, ale nie definiują protokołów służących do ustalania harmonogramu transmisji. Orchestra to scheduler, który pozwala węzłom na …
-
19 maja 2026 10:15
Wiktor Rutecki (MIMUW)
Przepisywanie zapytań w silniku RSONPath
RSONPath (https://github.com/rsonquery/rsonpath) to silnik szybkiego przetwarzania zapytań do dokumentów JSON za pomocą języka zapytań JSONPath. Jego implementacja ma swoje szczególne cechy, które przyspieszają wykonanie w porówaniu do analogicznych narzędzi. W swojej prezentacji omówię działanie JSONPath, …
-
12 maja 2026 11:00
Karol Wąsowski (MIMUW)
CMEmu: Synthesizing a Cycle-Exact Model of Program Execution on ARM Cortex-M (CMEmu: Synthesizing a Cycle-Exact Model of Program Execution on ARM Cortex-M)
W trakcie referatu opowiem o pracy powstałej w zespole systemów rozproszonych na MIMUW. Referat przybliży specyfikę platformy ARM korzystając z porównań do platformy x86. Przedstawione zostaną również metody badawcze wykorzystywane w procesie budowania emulatora dokładnego …
-
12 maja 2026 10:15
Dawid Pawlik (MIMUW)
Optymalizacja algorytmu GossipMap: Od binarnej kwantyzacji po obliczenia równoległe
W ramach wystąpienia zaprezentowany zostanie podstawowy algorytm GossipMap, stanowiący wydajną, rozproszoną wersję algorytmu InfoMap. Głównym punktem referatu będzie omówienie nowatorskiego podejścia do optymalizacji GossipMapa z wykorzystaniem techniki kwantyzacji binarnej, inspirowanej mechanizmami znanymi z algorytmu HNSW. …
-
5 maja 2026 10:15
Michał Sobczak (MIMUW)
Analiza skali wykorzystania autonomicznych narzędzi AI na platformie GitHub
W ramach prezentacji przedstawię postępy prac nad moim projektem badawczym, w którym analizuję zastosowanie agentów na platformie GitHub. Omówię przyjętą metodologię - w tym stosowane heurystyki, uproszczenia oraz wykorzystane technologie. Następnie przeanalizuję przebieg procesu badawczego, …
-
28 kwietnia 2026 10:15
Gustaw Blachowski (MIMUW)
Practical DB-OS Co-Design with Privileged Kernel Bypass (Practical DB-OS Co-Design with Privileged Kernel Bypass)
W ramach referatu przedstawię, w jaki sposób można wykorzystać wirtualizację żeby wspomóc współczesne DBMS. Na początku opiszę podstawowe pojęcia związane z wirtualizacją sprzętową. Następnie zaprezentuję "Dune" - moduł do jądra kernela, który pozwala na wirtualizację …
-
21 kwietnia 2026 10:15
Jose Emilio Labra Gayo (University of Oviedo, Spain)
Shaping Knowledge and Interoperable Graphs
Nie jesteś zalogowany |