Nie jesteś zalogowany | Zaloguj się
Powrót do listy seminarów

Seminarium "DeSeR: Dane, strumienie, rozpraszanie"

Tematyka seminarium obejmuje teorię i praktykę przetwarzania danych i reprezentacji wiedzy. Interesują nas wyzwania związane z przetwarzaniem danych, zapytań i metadanych (schematów, więzów, zależności, ontologii) - od projektowania i analizy abstrakcyjnych formalizmów aż po architekturę systemów i rozpraszanie obliczeń na dużych danych. Rozważamy różne rodzaje danych: nie tylko dane relacyjne, ale również semistrukturalne (XML, JSON), grafowe (RDF, LPG), obiektowe, tekstowe, temporalne, strumieniowe, aż po systemy informacji geograficznej (GIS).

Podejmujemy zarówno zagadnienia teoretyczne, wykorzystujące warsztat algorytmiki, kombinatoryki, logiki (np. teorii modeli skończonych) i teorii automatów, jak i praktyczne, opierające się na narzędziach inżynierii oprogramowania i wiedzy o systemach. Prace magisterskie powstające w ramach seminarium mogą badać rozstrzygalność i złożoność abstrakcyjnych problemów decyzyjnych, projektować algorytmy i heurystyki, implementować i testować istniejące rozwiązania teoretyczne, czy też analizować, porównywać i rozszerzać istniejące systemy.

Spotykamy się również i dyskutujemy z badaczami z innych dziedzin, którzy czasami dostarczają nam pomysłów na tematy prac magisterskich. Współpracowaliśmy już lub nadal współpracujemy z astronomami, chemikami, geografami. Jesteśmy nadal otwarci na inne obszary zastosowań.

Referaty seminaryjne są zwykle wygłaszane na podstawie wybranych prac z głównych międzynarodowych konferencji poświęconych bazom danych i reprezentacji wiedzy, takich jak VLDB, PODS, SIGMOD i KR.

Przykładowe zagadnienia:

* Data models, semantics, query languages

* Data provenance

* Databases for emerging hardware

* Distributed and parallel databases

* Graph data management, RDF, social networks, Semantic Web

* Knowledge discovery, clustering, data mining

* Machine learning for data management and vice versa

* Model theory, logics, algebras, computational complexity

* Ontology-based data access, data integration and exchange, metadata management

* Ontology formalisms and models, description logics

* Privacy, security, ethics

* Query processing and optimization

* Scientific databases

* Semi-structured data

* Small data, end-user programming

* Storage, indexing, and physical database design

* Streams, sensor networks, complex event processing

* Transaction processing

* Uncertainty, incompleteness, and inconsistency in data management


Organizatorzy

Informacje

wtorki, 10:15 , sala: 4060

Strona domowa

https://sites.google.com/view/sembdmimuw?pli=1&authuser=1

Dziedziny badań

Lista referatów

  • 15 grudnia 2022 12:15
    Michał Jadwiszczak (MIMUW)
    DBOS: system operacyjny oparty na bazie danych
    W referacie przedstawię DBOS, systemu operacyjnego oparty na rozproszonej bazie danych. Celem nowego OS jest natywne wsparcie rozproszonych aplikacji działających w chmurze w modelu serverless. Skupię się na omówieniu decyzji projektowych oraz prezentacji i analizie …

  • 8 grudnia 2022 12:15
    Damian Werpachowski
    Sundial: Odporny na awarie, system synchronizacji zegarów w centrach danych
    Tematyką dzisiejszego referatu będzie problem synchronizacji zegarów w centrach danych oraz system Sundial, który jest rozwiązaniem gwarantującym odporność na awarie w wielu klasycznych przypadkach. Zostanie omówione zastosowanie synchronizacji zegarów w popularnych bazach danych takich jak …

  • 1 grudnia 2022 12:15
    Bartosz Ruszewski (MIMUW)
    Problemy z Nullami z punktu widzenia użytkowników
    Podczas dzisiejszego referatu porozmawiamy o tym jak obecność nulli i logika trójwartościowa w SQL wpływa na intuicyjność wyników zapytań. Przenalizujemy wyniki ankiety przeprowadzonej wśród osób korzystających często z SQL i sprawdzimy w jakim stopniu zgadzają …

  • 24 listopada 2022 12:15
    Tomasz Domagała (MIMUW)
    Prefix Filter: Practically and Theoretically Better Than Bloom
    W niniejszym referacie zajmę się zagadnieniem filtrów. Zdefiniuję je i przedstawię ich zastosowania. Następnie przedstawię wysokopoziomowy opis sposobów ich realizacji oraz wady i zalety różnych filtrów, bloom, cuckoo, prefix. Dokładniej opiszę budowę filtrów opartych na "hash table of …

  • 10 listopada 2022 12:15
    Filip Murlak (MIMUW)
    Rel, czyli bazy danych (jeszcze) inacze)
    Rel, czyli bazy danych (jeszcze) inaczej.

  • 3 listopada 2022 12:15
    Jerzy Tyszkiewicz (MIMUW)
    Multizapytania
    Badamy rankingi generowane przez multizapytania, tzn. skończone multizbiory zapytań. Elementy danych są szeregowane według sumy ich odległości od elementów multizapytania. Opowiem dlaczego uważamy, że multizapytania są bardziej przyjazne dla użytkownika niż zapytania zaawansowane tworzone w oparciu o operatory …

  • 27 października 2022 12:15
    Piotr Sarna i Piotr Jastrzębski (SQLite)
    [ZDALNIE!] Co nowego w SQLite?
    UWAGA: Referat zdalny: https://meet.google.com/fdk-jesz-mfv SQLite to biblioteka implementująca bazę danych SQL, obecna na miliardach urządzeń elektronicznych. Jest ona rozwijana od 2000 roku i wciąż pojawiają się w niej nowe, ciekawe rozwiązania. Prezentacja zawiera podsumowanie architektury …

  • 20 października 2022 12:15
    Moshe Vardi (Rice University )
    How to be an Ethical Computer Scientist - projekcja filmu Youtube
    Wspólnie obejrzymy ten ważny referat i będziemy o nim dyskutować.   https://www.youtube.com/watch?v=yElHykHs02s Abstract: Many of us got involved in computing because programming was fun. The advantages of computing seemed intuitive to us. We truly believed that …

  • 13 października 2022 12:15
    Wojciech Mitros (MIMUW)
    WebAssembly jako język funkcji zdefiniowanych przez użytkownika (UDF) w rozproszonej bazie danyc)
    Choosing a language for user-defined functions in a database may have a considerable effect on the performance of the database - in every query, there may be multiple UDF's. Not every language can be used …

  • 9 czerwca 2022 12:15
    Michał Jadwiszczak (MIMUW)
    Omówienie i porównanie protokołów kontroli współbieżnego dostępu
    Prezentacja na podstawie pracy "An Evaluation of Distributed Concurrency Control". W dzisiejszych czasach bardzo dynamicznie zwiększającej się ilości generowanyc danych, nie jest możliwe by obsłużyć je na jednoserwerowej bazie danych. Stąd potrzeba rozproszonych baz danych, …

  • 2 czerwca 2022 12:15
    Jakub Martin (MIMUW)
    OctoSQL: Building a Universal SQL Query Tool and Ecosystem to work with Heterogeneous Kinds of Data
    UWAGA: REFERAT ZDALNY: https://meet.google.com/vhw-ojrp-gjs   OctoSQL (https://github.com/cube2222/octosql) to lokalne narzędzie pozwalające na uruchamianie zapytań SQL na różnego rodzaju plikach i bazach danych, w tym na łączenie danych z wielu źródeł jednocześnie. Na tym referacie skoncentruję …

  • 19 maja 2022 12:15
    Joachim Aleszkiewicz (MIMUW)
    Strumieniowa analiza gafów rzadkich
    Opowiem o strumieniowej analizie grafów w modelu semi-strumieniowym. Przedstawię pokrótce problemy stojące przed analizą dużych grafów i zaprezentuję efektywny sposób przechowywania stanu strumieniowanych grafów w celu ich przetwarzania, na podstawie pracy "Streaming Sparse Graphs using Efficient Dynamic Sets" (Brian …

  • 12 maja 2022 12:15
    Kuba Piwowar (SWPS)
    Identyfikacja uprzedzeń w AI
    Podczas spotkania przyjrzymy się źródłom uprzedzeń w modelach AI i na przykładach omówimy konkretne sposoby ich debiasowania. W tym celu skupimy się na tzw. word embeddings (załączam paper), aby podjąć próbę dekonstrukcji zjawiska algorithmic bias …

  • 7 kwietnia 2022 12:15
    Jerzy Tyszkiewicz (MIMUW)
    Range tree á la MPC
    Prezentacja alternatywnego algorytmu do zliczania zdominowanych punktów, z analizą złożoności w modelu MPC.

  • 24 marca 2022 12:15
    Marcin Jodłowiec (Politechnika Wrocławska, Wydział Informatyki i Telekomunikacji)
    Metody modelowania i translacji modeli baz danych dla metamodelu asocjacyjnego
    Uwaga referat zdalny. Link: https://meet.google.com/vhw-ojrp-gjs Streszczenie: Referat dotyczy osiągnięcia naukowego w zakresie opracowanych wzorców modelowania asocjacyjnych baz danych oraz translacji zarówno semantyki metamodelu asocjacyjnego, jak i samych modeli asocjacyjnych. Główną motywacją podjętego tematu była często występująca potrzeba …