Tematyka seminarium obejmuje teorię i praktykę przetwarzania danych i reprezentacji wiedzy. Interesują nas wyzwania związane z przetwarzaniem danych, zapytań i metadanych (schematów, więzów, zależności, ontologii) - od projektowania i analizy abstrakcyjnych formalizmów aż po architekturę systemów i rozpraszanie obliczeń na dużych danych. Rozważamy różne rodzaje danych: nie tylko dane relacyjne, ale również semistrukturalne (XML, JSON), grafowe (RDF, LPG), obiektowe, tekstowe, temporalne, strumieniowe, aż po systemy informacji geograficznej (GIS).
Podejmujemy zarówno zagadnienia teoretyczne, wykorzystujące warsztat algorytmiki, kombinatoryki, logiki (np. teorii modeli skończonych) i teorii automatów, jak i praktyczne, opierające się na narzędziach inżynierii oprogramowania i wiedzy o systemach. Prace magisterskie powstające w ramach seminarium mogą badać rozstrzygalność i złożoność abstrakcyjnych problemów decyzyjnych, projektować algorytmy i heurystyki, implementować i testować istniejące rozwiązania teoretyczne, czy też analizować, porównywać i rozszerzać istniejące systemy.
Spotykamy się również i dyskutujemy z badaczami z innych dziedzin, którzy czasami dostarczają nam pomysłów na tematy prac magisterskich. Współpracowaliśmy już lub nadal współpracujemy z astronomami, chemikami, geografami. Jesteśmy nadal otwarci na inne obszary zastosowań.
Referaty seminaryjne są zwykle wygłaszane na podstawie wybranych prac z głównych międzynarodowych konferencji poświęconych bazom danych i reprezentacji wiedzy, takich jak VLDB, PODS, SIGMOD i KR.
Przykładowe zagadnienia:
- Data models, semantics, query languages
- Data provenance
- Databases for emerging hardware
- Distributed and parallel databases
- Graph data management, RDF, social networks, Semantic Web
- Knowledge discovery, clustering, data mining
- Machine learning for data management and vice versa
- Model theory, logics, algebras, computational complexity
- Ontology-based data access, data integration and exchange, metadata management
- Ontology formalisms and models, description logics
- Privacy, security, ethics
- Query processing and optimization
- Scientific databases
- Semi-structured data
- Small data, end-user programming
- Storage, indexing, and physical database design
- Streams, sensor networks, complex event processing
- Transaction processing
- Uncertainty, incompleteness, and inconsistency in data management
Organizatorzy
- dr hab. Filip Murlak, prof. ucz.
- dr hab. Jacek Sroka
- prof. dr hab. Krzysztof Stencel
- prof. dr hab. Jerzy Tyszkiewicz
Informacje
wtorki, 10:15 , sala: 4060Strona domowa
https://sites.google.com/view/sembdmimuw?pli=1&authuser=1Dziedziny badań
Lista referatów
-
19 maja 2026 11:00
Zuzanna Ossowska (MIMUW)
Mechanizm Orchestra w środowisku Contiki-NG
W ramach referatu opowiem o metodach przesyłania danych w sieciach Internetu Rzeczy (IoT). Współczesne standardy komunikacji skutecznie ograniczają zakłócenia, ale nie definiują protokołów służących do ustalania harmonogramu transmisji. Orchestra to scheduler, który pozwala węzłom na …
-
19 maja 2026 10:15
Wiktor Rutecki (MIMUW)
Przepisywanie zapytań w silniku RSONPath
RSONPath (https://github.com/rsonquery/rsonpath) to silnik szybkiego przetwarzania zapytań do dokumentów JSON za pomocą języka zapytań JSONPath. Jego implementacja ma swoje szczególne cechy, które przyspieszają wykonanie w porówaniu do analogicznych narzędzi. W swojej prezentacji omówię działanie JSONPath, …
-
12 maja 2026 11:00
Karol Wąsowski (MIMUW)
CMEmu: Synthesizing a Cycle-Exact Model of Program Execution on ARM Cortex-M (CMEmu: Synthesizing a Cycle-Exact Model of Program Execution on ARM Cortex-M)
W trakcie referatu opowiem o pracy powstałej w zespole systemów rozproszonych na MIMUW. Referat przybliży specyfikę platformy ARM korzystając z porównań do platformy x86. Przedstawione zostaną również metody badawcze wykorzystywane w procesie budowania emulatora dokładnego …
-
12 maja 2026 10:15
Dawid Pawlik (MIMUW)
Optymalizacja algorytmu GossipMap: Od binarnej kwantyzacji po obliczenia równoległe
W ramach wystąpienia zaprezentowany zostanie podstawowy algorytm GossipMap, stanowiący wydajną, rozproszoną wersję algorytmu InfoMap. Głównym punktem referatu będzie omówienie nowatorskiego podejścia do optymalizacji GossipMapa z wykorzystaniem techniki kwantyzacji binarnej, inspirowanej mechanizmami znanymi z algorytmu HNSW. …
-
5 maja 2026 10:15
Michał Sobczak (MIMUW)
Analiza skali wykorzystania autonomicznych narzędzi AI na platformie GitHub
W ramach prezentacji przedstawię postępy prac nad moim projektem badawczym, w którym analizuję zastosowanie agentów na platformie GitHub. Omówię przyjętą metodologię - w tym stosowane heurystyki, uproszczenia oraz wykorzystane technologie. Następnie przeanalizuję przebieg procesu badawczego, …
-
28 kwietnia 2026 10:15
Gustaw Blachowski (MIMUW)
Practical DB-OS Co-Design with Privileged Kernel Bypass (Practical DB-OS Co-Design with Privileged Kernel Bypass)
W ramach referatu przedstawię, w jaki sposób można wykorzystać wirtualizację żeby wspomóc współczesne DBMS. Na początku opiszę podstawowe pojęcia związane z wirtualizacją sprzętową. Następnie zaprezentuję "Dune" - moduł do jądra kernela, który pozwala na wirtualizację …
-
21 kwietnia 2026 10:15
Jose Emilio Labra Gayo (University of Oviedo, Spain)
Shaping Knowledge and Interoperable Graphs
-
14 kwietnia 2026 10:15
Krzysztof Żyndul (MIMUW)
Finding Subgame Perfect Extreme Equilibria (Finding Subgame Perfect Extreme Equilibria)
-
24 marca 2026 10:15
Zuzanna Surowiec (MIMUW)
CAO: Optymalizacja zapytań złączeniowych z użyciem wyżarzania przestrzeni konformacyjnej
W moim referacie przypomnę problem optymalizacji kolejności złączeń oraz stosowane do niego podejścia. Omówię szerzej metodę wyżarzania przestrzeni konformacyjnej. Przedstawię jej warianty oraz porównam ich wady i zalety. Pokażę postępy w pisaniu rozszerzenia CAO dla …
-
17 marca 2026 10:15
Michał Molas (MIMUW)
Przegląd współczesnych metod prognozowania szeregów czasowych
Referat będzie stanowił analizę współczesnych metod prognozowania szeregów czasowych, przygotowaną na potrzeby mojej pracy magisterskiej pt. "Machine learning approaches to transportation order demand prediction", dotyczącej prognozowania popytu na zlecenia transportowe. Przedstawię ewolucję podejść badawczych: od …
-
10 marca 2026 10:15
Jakub Kłos (MIMUW)
Kompilacja wiedzy w walidacji względem PG-Schema
Grafy własnościowe są szeroko stosowane w dziedzinach, w których dane w naturalny sposób przyjmują strukturę grafu, takich jak sieci społecznościowe, finanse czy cyberbezpieczeństwo. Możliwość zapewnienia, że graf własnościowy jest zgodny ze specyfikacją schematu, ma kluczowe …
-
24 lutego 2026 10:15
Mateusz Gienieczko (Technische Universität München)
Przyszłość, bazy danych i Ty
Sprzęt rozwija się w trudnym do nadążenia tempie. Nowe architektury, koprocesory, ciągle zmieniająca się prędkość złączy, przez które przepływają nasze dane. Powoduje to eksplozję rozwiązań w świecie baz danych, gdzie każda zmiana w specyfikacji sprzętu …
-
20 stycznia 2026 11:00
Rem Karablin (MIMUW)
Ocena wydajności frameworków Hadoop, Spark i Flink w środowisku chmury hybrydowej
Problemem jest brak kompleksowej i porównawczej oceny frameworków Hadoop, Spark i Flink w środowisku chmury hybrydowej, w którym kluczowymi wyzwaniami są opóźnienia sieciowe, ograniczona przepustowość WAN oraz koszty wynikające z mechanizmu cloud burstingu; w celu …
-
20 stycznia 2026 10:15
Ewa Kaluś (MIMUW)
Beyond Shortest Paths: Node Fairness in Route Recommendation (Beyond Shortest Paths: Node Fairness in Route Recommendation)
Podczas seminarium przedstawię pracę "Beyond Shortest Paths: Node Fairness in Route Recommendation" (VLDB 2025) (https://www.vldb.org/pvldb/vol18/p3230-ferrara.pdf}. Autorzy pracy wskazują ważny problem w systemach nawigacyjnych: gdy wszyscy użytkownicy otrzymują tę samą najkrótszą trasę, punkty położone poza nią …
-
13 stycznia 2026 10:15
Katarzyna Mielnik (MIMUW)
Jodes: Efficient Oblivious Join in the Distributed Setting (Jodes: Efficient Oblivious Join in the Distributed Setting)
Tematem prezentacji jest implementacja algorytmu rozproszonego equi-join, skutecznie chroniącego wzorce dostępu do danych w komunikacji międzywęzłowej. Omówię architekturę rozwiązania oraz zestawienie jego efektywności z istniejącymi metodami. (https://www.vldb.org/pvldb/vol18/p1291-wang.pdf)
Nie jesteś zalogowany |