PhD Defense of Wim Le Page

•Download as KEY, PDF•

2 likes•412 views

ADReM UA

Public defense of the PhD-thesis: "Mining Patterns in Relational Databases", by Wim Le Page, 16 december 2009.

Technology

Mining Patterns in Relational Databases
Wim Le Page

16 december 2009

selection,
transformation

database
data
mining

data

evaluation,
presentation

patterns

knowledge

shop
selection,
transformation

database
data
mining

data
evaluation,
presentation

patterns

knowledge

shop
selection,
transformation

database
frequent
itemset
mining

data
evaluation,
presentation

patterns

knowledge

shop
selection,
transformation

database
frequent
itemset
mining

data
evaluation,
presentation

patterns 75%

knowledge

1000
products

21000 possible
itemsets

≈10 301

1000
products

21000 possible
itemsets

≈10 301
=1000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

Professor
ID Name Age Title
1 Barabas 65 Prof. dr.
2 Gobelijn 65 Prof. dr.
3 Adhemar 10 Prof. dr.

Course
Professor
ID Name SP Room Project
ID Name Age Title
1 Databases 60 G010 Y
1 Barabas 65 Prof. dr.
2 Data Mining 30 G005 N
2 Gobelijn 65 Prof. dr.
3 AI 60 G005 Y
3 Adhemar 10 Prof. dr.
4 XML 30 G005 Y

Database
Course
Professor
ID Name SP Room Project
ID Name Age Title
1 Databases 60 G010 Y
1 Barabas 65 Prof. dr.
2 Data Mining 30 G005 N
2 Gobelijn 65 Prof. dr.
3 AI 60 G005 Y
3 Adhemar 10 Prof. dr.
4 XML 30 G005 Y

Student
ID Name Age Sex
1 Marcel 40 M
2 Fanny 19 F
3 Konstantinopel 12 M
4 Charlotte 40 F
5 Vital 56 M

Database
Teaches
Course
Professor Prof.ID Course.ID
ID Name SP Room Project
ID Name Age Title 1 2
1 Databases 60 G010 Y
1 Barabas 65 Prof. dr. 1 3
2 Data Mining 30 G005 N
2 Gobelijn 65 Prof. dr. 2 1
3 AI 60 G005 Y
3 Adhemar 10 Prof. dr. 2 4
4 XML 30 G005 Y
3 4

Student
ID Name Age Sex
1 Marcel 40 M
2 Fanny 19 F
3 Konstantinopel 12 M
4 Charlotte 40 F
5 Vital 56 M

Relational Database
Teaches
Course
Professor Prof.ID Course.ID
ID Name SP Room Project
ID Name Age Title 1 2
1 Databases 60 G010 Y
1 Barabas 65 Prof. dr. 1 3
2 Data Mining 30 G005 N
2 Gobelijn 65 Prof. dr. 2 1
3 AI 60 G005 Y
3 Adhemar 10 Prof. dr. 2 4
4 XML 30 G005 Y
3 4

Takes
Student.ID Course.ID
1 1
1 3
2 2
2 4
Student 3 1

ID Name Age Sex 3 2

1 Marcel 40 M 3 3
2 Fanny 19 F 3 4
3 Konstantinopel 12 M 4 1
4 Charlotte 40 F 5 3
5 Vital 56 M

selection,
transformation

relational
database data
mining
data

evaluation,
presentation

patterns

knowledge

relational
data
mining

relational relational
data patterns

Queries

Which students are male?

Which professors teach a
course in room G010?

Queries

Which students are male?

Which professors teach a
course in room G010?

Which courses have a project and
are taken by female students?

Queries

Which courses have a project and
are taken by female students?

Queries

Which courses have a project and
are taken by female students?

SELECT DISTINCT Course.ID
FROM Course, Takes, Student
WHERE Course.project = ‘Y’
AND Student.sex = ‘F’
AND Student.ID = Takes.StudentID
AND Course.ID = Takes.CourseID

Queries

Which courses have a project and
are taken by female students?

SELECT DISTINCT Course.ID
FROM Course, Takes, Student
ID Name SP Room Project
WHERE Course.project = ‘Y’
1 Databases 60 G010 Y
AND Student.sex = ‘F’
AND Student.ID = Takes.StudentID 4 XML 30 G005 Y
AND Course.ID = Takes.CourseID

Queries

SELECT DISTINCT Course.ID
FROM Course, Takes, Student
WHERE Course.project = ‘Y’
AND Student.sex = ‘F’
AND Student.ID = Takes.StudentID
AND Course.ID = Takes.CourseID

Queries

General
SELECT DISTINCT Course.ID
FROM Course, Takes, Student
WHERE Course.project = ‘Y’
AND Student.sex = ‘F’
AND Student.ID = Takes.StudentID
AND Course.ID = Takes.CourseID

Queries

General Efﬁcient
SELECT DISTINCT Course.ID
FROM Course, Takes, Student
WHERE Course.project = ‘Y’
AND Student.sex = ‘F’
AND Student.ID = Takes.StudentID
AND Course.ID = Takes.CourseID

Queries

ID Name Age Sex

Which students are male? 1
3
Marcel
Konstantinopel
40
12
M
M
5 Vital 56 M

ID Name Age Title Which professors teach a
course in room G010?
2 Gobelijn 65 Prof. dr.

Which courses have a project and ID
1
Name
Databases
SP
60
Room
G010
Project
Y

are taken by female students? 4 XML 30 G005 Y

Frequent Queries

ID Name Age Sex

Which students are male? 1
3
Marcel
Konstantinopel
40
12
M
M
5 Vital 56 M

ID Name Age Title Which professors teach a
course in room G010?
2 Gobelijn 65 Prof. dr.

Which courses have a project and ID
1
Name
Databases
SP
60
Room
G010
Project
Y

are taken by female students? 4 XML 30 G005 Y

Frequent Queries

Which courses have a project and ID
1
Name
Databases
SP
60
Room
G010
Project
Y

are taken by female students? 4 XML 30 G005 Y

Frequent Queries

ID Name SP Room Project

Which courses have a project? 1
3
4
Databases
AI
XML
60
60
30
G010
G005
G005
Y
Y
Y

Which courses have a project and ID
1
Name
Databases
SP
60
Room
G010
Project
Y

are taken by female students? 4 XML 30 G005 Y

Frequent Queries

66% of courses with a project are
taken by female students

ID Name SP Room Project

Which courses have a project? 1
3
4
Databases
AI
XML
60
60
30
G010
G005
G005
Y
Y
Y

Which courses have a project and ID
1
Name
Databases
SP
60
Room
G010
Project
Y

are taken by female students? 4 XML 30 G005 Y

Contained Frequent Queries

66% of courses with a project are
taken by female students

ID Name SP Room Project

Which courses have a project? 1
3
4
Databases
AI
XML
60
60
30
G010
G005
G005
Y
Y
Y

Which courses have a project and ID
1
Name
Databases
SP
60
Room
G010
Project
Y

are taken by female students? 4 XML 30 G005 Y

relational
data
mining

relational pairs of contained
data frequent queries

Conqueror
Algorithm

relational pairs of contained
data frequent queries

Conqueror
Algorithm

Generate queries
Evaluate queries

Conqueror
Algorithm

Generate queries
Evaluate queries
Pair queries

Conqueror
Algorithm Generate queries

Simple Conjunctive Queries

Conqueror
Algorithm Generate queries

Simple Conjunctive Queries

A=B

Conqueror
Algorithm Generate queries

Simple Conjunctive Queries

A=B

A>B

Conqueror
Algorithm Generate queries

Simple Conjunctive Queries

A=B R×1

A>B

Conqueror
Algorithm Generate queries

Simple Conjunctive Queries

A=B R×1

A>B R,R

Conqueror
Algorithm Generate queries

SELECT DISTINCT Course.ID
FROM Course, Takes, Student
WHERE Course.project = ‘Y’
AND Student.sex = ‘F’
AND Student.ID = Takes.StudentID
AND Course.ID = Takes.CourseID

Conqueror
Algorithm Generate queries

⋈ Student.ID = Takes.StudentID
AND Course.ID = Takes.CourseID

SELECT DISTINCT Course.ID
FROM Course, Takes, Student
WHERE Course.project = ‘Y’
AND Student.sex = ‘F’
AND Student.ID = Takes.StudentID
AND Course.ID = Takes.CourseID

Conqueror
Algorithm Generate queries

⋈ Student.ID = Takes.StudentID
AND Course.ID = Takes.CourseID

π SELECT DISTINCT Course.ID

SELECT DISTINCT Course.ID
FROM Course, Takes, Student
WHERE Course.project = ‘Y’
AND Student.sex = ‘F’
AND Student.ID = Takes.StudentID
AND Course.ID = Takes.CourseID

Conqueror
Algorithm Generate queries

⋈ Student.ID = Takes.StudentID
AND Course.ID = Takes.CourseID

π SELECT DISTINCT Course.ID

σ Course.project = ‘Y’
AND Student.sex = ‘F’

SELECT DISTINCT Course.ID
FROM Course, Takes, Student
WHERE Course.project = ‘Y’
AND Student.sex = ‘F’
AND Student.ID = Takes.StudentID
AND Course.ID = Takes.CourseID

The number of players that play a
quiz they made themselves?

The number of players that play a quiz they
made themselves and got the maximum score?

The number of players that play a
quiz they made themselves?

The number of players that play a quiz they
made themselves and got the maximum score?
= 86% of
The number of players that play a
quiz they made themselves?

The number of quizzes that
are played in 2006?

The number of quizzes that
are played?

The number of quizzes that
are played in 2006?
= 91% of
The number of quizzes that
are played?

The number of quizzes that
are played in 2006?
= 91% of
The number of quizzes that
are played?

majorityof the quizzes
were played in 2006

The number of players that
play a quiz that exists?

The number of players?

The number of players that
play a quiz that exists?
= 99% of
The number of players?

The number of players that
play a quiz that exists?
= 99% of
The number of players?

1%
of the players play a quiz
that does notexist

Itemsets
Market Baskets
ID Bread Butter Cheese Wine
1 Y Y N N
2 Y N Y N
3 Y N Y Y
4 Y Y Y Y
5 Y N N N
6 Y N Y Y
7 Y Y Y N
8 N N N N
9 N Y Y Y
10 N Y N N
11 Y N Y Y
12 N N Y Y

Itemsets
Market Baskets
ID
1
Bread
Y
Butter
Y
Cheese
N
Wine
N
frequent
2 Y N Y N
itemset
mining
3 Y N Y Y
4 Y Y Y Y
5 Y N N N
6 Y N Y Y
7 Y Y Y N
8 N N N N
9 N Y Y Y
10 N Y N N
11 Y N Y Y
12 N N Y Y

Itemsets
Market Baskets
ID Bread Butter Cheese Wine
frequent {(Cheese=Y)}
1 Y Y N N
2 Y N Y N
itemset
mining
3 Y N Y Y
4 Y Y Y Y
5 Y N N N
6 Y N Y Y
7 Y Y Y N
8 N N N N
9 N Y Y Y
10 N Y N N
11 Y N Y Y
12 N N Y Y

Itemsets
Market Baskets
ID Bread Butter Cheese Wine
frequent {(Cheese=Y)}
1 Y Y N N
2 Y N Y N
itemset {2,3,4,6,7,9,11,12}
mining
3 Y N Y Y
4 Y Y Y Y
5 Y N N N
6 Y N Y Y
7 Y Y Y N
8 N N N N
9 N Y Y Y
10 N Y N N
11 Y N Y Y
12 N N Y Y

Itemsets
Market Baskets
ID Bread Butter Cheese Wine
frequent {(Cheese=Y)}
1 Y Y N N
2 Y N Y N
itemset {2,3,4,6,7,9,11,12} 8/12 = 67%
mining
3 Y N Y Y
4 Y Y Y Y
5 Y N N N
6 Y N Y Y
7 Y Y Y N
8 N N N N
9 N Y Y Y
10 N Y N N
11 Y N Y Y
12 N N Y Y

Itemsets
Market Baskets
ID Bread Butter Cheese Wine
frequent {(Cheese=Y)}
1 Y Y N N
2 Y N Y N
itemset {2,3,4,6,7,9,11,12} 8/12 = 67%
mining
3 Y N Y Y
4 Y Y Y Y
5
6
Y
Y
N
N
N
Y
N
Y
{(Wine=Y)}
7 Y Y Y N
8 N N N N
9 N Y Y Y
10 N Y N N
11 Y N Y Y
12 N N Y Y

Itemsets

Student
ID Name Age Sex
1 Marcel 40 M
2 Fanny 19 F
3 Konstantinopel 12 M
4 Charlotte 40 F
5 Vital 56 M

Itemsets

Course
ID Name SP Room Project
1 Databases 60 G010 Y
Student
2 Data Mining 30 G005 N
3 AI 60 G005 Y ID Name Age Sex
4 XML 30 G005 Y 1 Marcel 40 M
2 Fanny 19 F
3 Konstantinopel 12 M
Professor 4 Charlotte 40 F
ID Name Age Title 5 Vital 56 M
1 Barabas 65 Prof. dr.
2 Gobelijn 65 Prof. dr.
3 Adhemar 10 Prof. dr.

Itemsets

Course Takes
ID Name SP Room Project
Student.ID Course.ID
1 Databases 60 G010 Y
Student Teaches 1 1
2 Data Mining 30 G005 N
ID Name Age Sex Prof.ID Course.ID 1 3
3 AI 60 G005 Y
4 XML 30 G005 Y 1 Marcel 40 M 1 2 2 2
2 Fanny 19 F 1 3 2 4
3 Konstantinopel 12 M 2 1 3 1
Professor 4 Charlotte 40 F 2 4 3 2
ID Name Age Title 5 Vital 56 M 3 4 3 3
1 Barabas 65 Prof. dr. 3 4
2 Gobelijn 65 Prof. dr. 4 1
3 Adhemar 10 Prof. dr. 5 3

Itemsets

Full Outer Join
S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title
1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr.
1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr.
2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr.
2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr.
3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr.
3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr.
3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr.
3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr.
4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr.
4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr.
5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.

The Key Idea
Student
Professor
ID Name Age Sex
ID Name Age Title
1 Marcel 40 M
1 Barabas 65 Prof. dr.
2 Fanny 19 F
2 Gobelijn 65 Prof. dr.
3 Konstantinopel 12 M
3 Adhemar 10 Prof. dr.
4 Charlotte 40 F
5 Vital 56 M

Course
ID Name SP Room Project
1 Databases 60 G010 Y
2 Data Mining 30 G005 N
3 AI 60 G005 Y
4 XML 30 G005 Y

The Key Idea
S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title
1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr.
1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr.
2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr.
2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr.
3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr.
3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr.
3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr.
3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr.
4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr.
4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr.
5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.

The Key Idea
{(SP=30)}
S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title
1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr.
1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr.
2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr.
2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr.
3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr.
3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr.
3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr.
3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr.
4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.
4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr.
4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr.
5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.

Similar to PhD Defense of Wim Le Page

Data mining

Akannsha Totewar

Big data meets big analytics

Deepak Ramanathan

Asian Bankers Association, Manila Conference

Deepak Ramanathan

Jean-Marc Lazard d'Exalead - Pioneering hypermedia - SEO Campus 2011

SEO CAMP

Big Data Analytics is characterized by analysis of data on three vectors: exploding data volume, proliferating data variety (relational, multi-media), and accelerating data velocity. However, other key vectors such as costs and skill set needed for Big Data Analytics are often overlooked. In this session, we will consider all five vectors by exploring various techniques where traditional but progressive technologies such as column store DBMS and Event Stream Processing is combined with open source frameworks such as Hadoop to exploit the full potential of Big Data Analytics. Agenda: - Big Data Analytics in the real world - Commercial and Open Source techniques - Bringing together Commercial and Open Source techniques * Architectures * Programming APIs (e.g. embedded and federated MapReduce) - Conclusions

Big Data Analytics in a Heterogeneous World - Joydeep Das of Sybase

BigDataCloud

Farklı Ortamlarda Büyük Veri Kavramı -Big Data by Sybase

Sybase Türkiye

Data mining strategy powerpoint ppt slides.

SlideTeam.net

Data mining process powerpoint presentation templates.

SlideTeam.net

Data mining strategy powerpoint ppt templates.

SlideTeam.net

Data mining process powerpoint ppt templates.

SlideTeam.net

Data mining strategy powerpoint presentation templates.

SlideTeam.net

Data mining process powerpoint presentation slides.

SlideTeam.net

Graph

amooool2000

Data mining & Decison Trees

Selman Bozkır

Streaming Hadoop for Enterprise Adoption

DATAVERSITY

Data warehousing

Mandar Kulkarni

Similar to PhD Defense of Wim Le Page (16)

Data mining

Big data meets big analytics

Asian Bankers Association, Manila Conference

Jean-Marc Lazard d'Exalead - Pioneering hypermedia - SEO Campus 2011

Big Data Analytics in a Heterogeneous World - Joydeep Das of Sybase

Farklı Ortamlarda Büyük Veri Kavramı -Big Data by Sybase

Data mining strategy powerpoint ppt slides.

Data mining process powerpoint presentation templates.

Data mining strategy powerpoint ppt templates.

Data mining process powerpoint ppt templates.

Data mining strategy powerpoint presentation templates.

Data mining process powerpoint presentation slides.

Graph

Data mining & Decison Trees

Streaming Hadoop for Enterprise Adoption

Data warehousing

Recently uploaded

Exploring Multimodal Embeddings with Milvus

Zilliz

Following the popularity of “Cloud Revolution: Exploring the New Wave of Serverless Spatial Data,” we’re thrilled to announce this much-anticipated encore webinar. In this sequel, we’ll dive deeper into the Cloud-Native realm by uncovering practical applications and FME support for these new formats, including COGs, COPC, FlatGeoBuf, GeoParquet, STAC, and ZARR. Building on the foundation laid by industry leaders Michelle Roby of Radiant Earth and Chris Holmes of Planet in the first webinar, this second part offers an in-depth look at the real-world application and behind-the-scenes dynamics of these cutting-edge formats. We will spotlight specific use-cases and workflows, showcasing their efficiency and relevance in practical scenarios. Discover the vast possibilities each format holds, highlighted through detailed discussions and demonstrations. Our expert speakers will dissect the key aspects and provide critical takeaways for effective use, ensuring attendees leave with a thorough understanding of how to apply these formats in their own projects. Elevate your understanding of how FME supports these cutting-edge technologies, enhancing your ability to manage, share, and analyze spatial data. Whether you’re building on knowledge from our initial session or are new to the serverless spatial data landscape, this webinar is your gateway to mastering cloud-native formats in your workflows.

Cloud Frontiers: A Deep Dive into Serverless Spatial Data and FME

Safe Software

Three things you will take away from the session: • How to run an effective tenant-to-tenant migration • Best practices for before, during, and after migration • Tips for using migration as a springboard to prepare for Copilot in Microsoft 365 Main ideas: Migration Overview: The presentation covers the current reality of cross-tenant migrations, the triggers, phases, best practices, and benefits of a successful tenant migration Considerations: When considering a migration, it is important to consider the migration scope, performance, customization, flexibility, user-friendly interface, automation, monitoring, support, training, scalability, data integrity, data security, cost, and licensing structure Next Wave: The next wave of change includes the launch of Copilot, which requires businesses to be prepared for upcoming changes related to Copilot and the cloud, and to consolidate data and tighten governance ShareGate: ShareGate can help with pre-migration analysis, configurable migration tool, and automated, end-user driven collaborative governance

Strategize a Smooth Tenant-to-tenant Migration and Copilot Takeoff

sammart93

Manulife - Insurer Transformation Award 2024

The Digital Insurer

Sidekick Solutions uses Bonterra Impact Management (fka Social Solutions Apricot) and automation solutions to integrate data for business workflows. We believe integration and automation are essential to user experience and the promise of efficient work through technology. Automation is the critical ingredient to realizing that full vision. We develop integration products and services for Bonterra Case Management software to support the deployment of automations for a variety of use cases. This video focuses on the deployment of external web forms using Jotform for Bonterra Impact Management. This solution can be customized to your organization’s needs and deployed to support the common use cases below: - Intake and consent - Assessments - Surveys - Applications - Program registration Interested in deploying web form automations for Bonterra Impact Management? Contact us at sales@sidekicksolutionsllc.com to discuss next steps.

Web Form Automation for Bonterra Impact Management (fka Social Solutions Apri...

Jeffrey Haguewood

Tracing the root cause of a performance issue requires a lot of patience, experience, and focus. It’s so hard that we sometimes attempt to guess by trying out tentative fixes, but that usually results in frustration, messy code, and a considerable waste of time and money. This talk explains how to correctly zoom in on a performance bottleneck using three levels of profiling: distributed tracing, metrics, and method profiling. After we learn to read the JVM profiler output as a flame graph, we explore a series of bottlenecks typical for backend systems, like connection/thread pool starvation, invisible aspects, blocking code, hot CPU methods, lock contention, and Virtual Thread pinning, and we learn to trace them even if they occur in library code you are not familiar with. Attend this talk and prepare for the performance issues that will eventually hit any successful system. About authorWith two decades of experience, Victor is a Java Champion working as a trainer for top companies in Europe. Five thousands developers in 120 companies attended his workshops, so he gets to debate every week the challenges that various projects struggle with. In return, Victor summarizes key points from these workshops in conference talks and online meetups for the European Software Crafters, the world’s largest developer community around architecture, refactoring, and testing. Discover how Victor can help you on victorrentea.ro : company training catalog, consultancy and YouTube playlists.

Finding Java's Hidden Performance Traps @ DevoxxUK 2024

Victor Rentea

Corporate and higher education. Two industries that, in the past, have had a clear divide with very little crossover. The difference in goals, learning styles and objectives paved the way for differing learning technologies platforms to evolve. Now, those stark lines are blurring as both sides are discovering they have content that’s relevant to the other. Join Tammy Rutherford as she walks through the pros and cons of corporate and higher ed collaborating. And the challenges of these different technology platforms working together for a brighter future.

Corporate and higher education May webinar.pptx

Rustici Software

Webinar Recording: https://www.panagenda.com/webinars/why-teams-call-analytics-is-critical-to-your-entire-business Nothing is as frustrating and noticeable as being in an important call and being unable to see or hear the other person. Not surprising then, that issues with Teams calls are among the most common problems users call their helpdesk for. Having in depth insight into everything relevant going on at the user’s device, local network, ISP and Microsoft itself during the call is crucial for good Microsoft Teams Call quality support. To ensure a quick and adequate solution and to ensure your users get the most out of their Microsoft 365. But did you know that ‘bad calls’ are also an excellent indicator of other problems arising? Precisely because it is so noticeable!? Like the canary in the mine, bad calls can be early indicators of problems. Problems that might otherwise not have been noticed for a while but can have a big impact on productivity and satisfaction. Join this session by Christoph Adler to learn how true Microsoft Teams call quality analytics helped other organizations troubleshoot bad calls and identify and fix problems that impacted Teams calls or the use of Microsoft365 in general. See what it can do to keep your users happy and productive! In this session we will cover - Why CQD data alone is not enough to troubleshoot call problems - The importance of attributing call problems to the right call participant - What call quality analytics can do to help you quickly find, fix-, and prevent problems - Why having retrospective detailed insights matters - Real life examples of how others have used Microsoft Teams call quality monitoring to problem shoot problems with their ISP, network, device health and more.

Why Teams call analytics are critical to your entire business

panagenda

In the thrilling conclusion to 2023, ransomware groups had a banner year, really outdoing themselves in the "make everyone's life miserable" department. LockBit 3.0 took gold in the hacking olympics, followed by the plucky upstarts Clop and ALPHV/BlackCat. Apparently, 48% of organizations were feeling left out and decided to get in on the cyber attack action. Business services won the "most likely to get digitally mugged" award, with education and retail nipping at their heels. Hackers expanded their repertoire beyond boring old encryption to the much more exciting world of extortion. The US, UK and Canada took top honors in the "countries most likely to pay up" category. Bitcoins were the currency of choice for discerning hackers, because who doesn't love untraceable money?

Ransomware_Q4_2023. The report. [EN].pdf

Overkill Security

Dubai, often portrayed as a shimmering oasis in the desert, faces its own set of challenges, including the occasional threat of flooding. Despite its reputation for opulence and modernity, the emirate is not immune to the forces of nature. In recent years, Dubai has experienced sporadic but significant floods, testing the resilience of its infrastructure and communities. Among the critical lifelines in this bustling metropolis is the Dubai International Airport, a bustling hub that connects the city to the world. This article explores the intersection of Dubai flood events and the resilience demonstrated by the Dubai International Airport in the face of such challenges.

Navigating the Deluge_ Dubai Floods and the Resilience of Dubai International...

Orbitshub

2024: Domino Containers - The Next Step. News from the Domino Container commu...

Martijn de Jong

Architecting Cloud Native Applications

WSO2

ICT role in 21st century education and its challenges

rafiqahmad00786416

Abhishek Deb(1), Mr Abdul Kalam(2) M. Des (UX) , School of Design, DIT University , Dehradun. This paper explores the future potential of AI-enabled smartphone processors, aiming to investigate the advancements, capabilities, and implications of integrating artificial intelligence (AI) into smartphone technology. The research study goals consist of evaluating the development of AI in mobile phone processors, analyzing the existing state as well as abilities of AI-enabled cpus determining future patterns as well as chances together with reviewing obstacles as well as factors to consider for more growth.

Exploring the Future Potential of AI-Enabled Smartphone Processors

debabhi2

How to Troubleshoot Apps for the Modern Connected Worker

ThousandEyes

"I see eyes in my soup": How Delivery Hero implemented the safety system for ...

Zilliz

💥 You’re lucky! We’ve found two different (lead) developers that are willing to share their valuable lessons learned about using UiPath Document Understanding! Based on recent implementations in appealing use cases at Partou and SPIE. Don’t expect fancy videos or slide decks, but real and practical experiences that will help you with your own implementations. 📕 Topics that will be addressed: • Training the ML-model by humans: do or don't? • Rule-based versus AI extractors • Tips for finding use cases • How to start 👨‍🏫👨‍💻 Speakers: o Dion Morskieft, RPA Product Owner @Partou o Jack Klein-Schiphorst, Automation Developer @Tacstone Technology

DEV meet-up UiPath Document Understanding May 7 2024 Amsterdam

UiPathCommunity

Keynote 2: APIs in 2030: The Risk of Technological Sleepwalk Paolo Malinverno, Growth Advisor - The Business of Technology Apidays New York 2024: The API Economy in the AI Era (April 30 & May 1, 2024) ------ Check out our conferences at https://www.apidays.global/ Do you want to sponsor or talk at one of our conferences? https://apidays.typeform.com/to/ILJeAaV8 Learn more on APIscene, the global media made by the community for the community: https://www.apiscene.io Explore the API ecosystem with the API Landscape: https://apilandscape.apiscene.io/

Apidays New York 2024 - APIs in 2030: The Risk of Technological Sleepwalk by ...

apidays

ProductAnonymous-April2024-WinProductDiscovery-MelissaKlemke

Product Anonymous

Strategies for Landing an Oracle DBA Job as a Fresher

Remote DBA Services

Recently uploaded (20)

Exploring Multimodal Embeddings with Milvus

Cloud Frontiers: A Deep Dive into Serverless Spatial Data and FME

Strategize a Smooth Tenant-to-tenant Migration and Copilot Takeoff

Manulife - Insurer Transformation Award 2024

Web Form Automation for Bonterra Impact Management (fka Social Solutions Apri...

Finding Java's Hidden Performance Traps @ DevoxxUK 2024

Corporate and higher education May webinar.pptx

Why Teams call analytics are critical to your entire business

Ransomware_Q4_2023. The report. [EN].pdf

Navigating the Deluge_ Dubai Floods and the Resilience of Dubai International...

2024: Domino Containers - The Next Step. News from the Domino Container commu...

Architecting Cloud Native Applications

ICT role in 21st century education and its challenges

Exploring the Future Potential of AI-Enabled Smartphone Processors

How to Troubleshoot Apps for the Modern Connected Worker

"I see eyes in my soup": How Delivery Hero implemented the safety system for ...

DEV meet-up UiPath Document Understanding May 7 2024 Amsterdam

Apidays New York 2024 - APIs in 2030: The Risk of Technological Sleepwalk by ...

ProductAnonymous-April2024-WinProductDiscovery-MelissaKlemke

Strategies for Landing an Oracle DBA Job as a Fresher

PhD Defense of Wim Le Page

1. Mining Patterns in Relational Databases Wim Le Page 16 december 2009

2. Mining?

3. Data

4. Knowledge

5. selection, transformation database data mining data evaluation, presentation patterns knowledge

6. selection, transformation database data mining data evaluation, presentation patterns knowledge

7. selection, transformation database data mining data evaluation, presentation patterns knowledge

8. selection, transformation database data mining data evaluation, presentation patterns knowledge

9. selection, transformation database data mining data evaluation, presentation patterns knowledge

10. selection, transformation database data mining data evaluation, presentation patterns knowledge

11. selection, transformation database data mining data evaluation, presentation patterns knowledge

12. market basket analysis

13. selection, transformation database data mining data evaluation, presentation patterns knowledge

14. shop selection, transformation database data mining data evaluation, presentation patterns knowledge

15. shop selection, transformation database data mining data evaluation, presentation patterns knowledge

16. shop selection, transformation database frequent itemset mining data evaluation, presentation patterns knowledge

17. shop selection, transformation database frequent itemset mining data evaluation, presentation patterns knowledge

18. shop selection, transformation database frequent itemset mining data evaluation, presentation patterns 75% knowledge

19.

20. 1000 products

21. 1000 products 21000 possible itemsets

22. 1000 products 21000 possible itemsets ≈10 301

23. 1000 products 21000 possible itemsets ≈10 301 =1000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

24.

25. efﬁcient algorithms

26. Database

27.

28.

29. Professor ID Name Age Title 1 Barabas 65 Prof. dr. 2 Gobelijn 65 Prof. dr. 3 Adhemar 10 Prof. dr.

30. Course Professor ID Name SP Room Project ID Name Age Title 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 4 XML 30 G005 Y

31. Course Professor ID Name SP Room Project ID Name Age Title 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 4 XML 30 G005 Y Student ID Name Age Sex 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M 4 Charlotte 40 F 5 Vital 56 M

32. Database Course Professor ID Name SP Room Project ID Name Age Title 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 4 XML 30 G005 Y Student ID Name Age Sex 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M 4 Charlotte 40 F 5 Vital 56 M

33. Database Course Professor ID Name SP Room Project ID Name Age Title 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 4 XML 30 G005 Y Student ID Name Age Sex 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M 4 Charlotte 40 F 5 Vital 56 M

34. Database Teaches Course Professor Prof.ID Course.ID ID Name SP Room Project ID Name Age Title 1 2 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 1 3 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 2 1 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 2 4 4 XML 30 G005 Y 3 4 Student ID Name Age Sex 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M 4 Charlotte 40 F 5 Vital 56 M

35. Database Teaches Course Professor Prof.ID Course.ID ID Name SP Room Project ID Name Age Title 1 2 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 1 3 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 2 1 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 2 4 4 XML 30 G005 Y 3 4 Student ID Name Age Sex 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M 4 Charlotte 40 F 5 Vital 56 M

36. Database Teaches Course Professor Prof.ID Course.ID ID Name SP Room Project ID Name Age Title 1 2 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 1 3 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 2 1 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 2 4 4 XML 30 G005 Y 3 4 Takes Student.ID Course.ID 1 1 1 3 2 2 2 4 Student 3 1 ID Name Age Sex 3 2 1 Marcel 40 M 3 3 2 Fanny 19 F 3 4 3 Konstantinopel 12 M 4 1 4 Charlotte 40 F 5 3 5 Vital 56 M

37. Relational Database Teaches Course Professor Prof.ID Course.ID ID Name SP Room Project ID Name Age Title 1 2 1 Databases 60 G010 Y 1 Barabas 65 Prof. dr. 1 3 2 Data Mining 30 G005 N 2 Gobelijn 65 Prof. dr. 2 1 3 AI 60 G005 Y 3 Adhemar 10 Prof. dr. 2 4 4 XML 30 G005 Y 3 4 Takes Student.ID Course.ID 1 1 1 3 2 2 2 4 Student 3 1 ID Name Age Sex 3 2 1 Marcel 40 M 3 3 2 Fanny 19 F 3 4 3 Konstantinopel 12 M 4 1 4 Charlotte 40 F 5 3 5 Vital 56 M

38. selection, transformation database data mining data evaluation, presentation patterns knowledge

39. selection, transformation database data mining data evaluation, presentation patterns knowledge

40. selection, transformation relational database data mining data evaluation, presentation patterns knowledge

41. selection, transformation relational database data mining data evaluation, presentation patterns knowledge

42. data mining data patterns

43. relational data mining data patterns

44. relational data mining relational relational data patterns

45.

46. Queries

47. Queries Itemsets

48. Queries

49. Queries Which students are male?

50. Queries Which students are male? Which professors teach a course in room G010?

51. Queries Which students are male? Which professors teach a course in room G010? Which courses have a project and are taken by female students?

52. Queries Which courses have a project and are taken by female students?

53. Queries Which courses have a project and are taken by female students?

54. Queries Which courses have a project and are taken by female students? SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID

55. Queries Which courses have a project and are taken by female students? SELECT DISTINCT Course.ID FROM Course, Takes, Student ID Name SP Room Project WHERE Course.project = ‘Y’ 1 Databases 60 G010 Y AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID 4 XML 30 G005 Y AND Course.ID = Takes.CourseID

56. Queries SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID

57. Queries General SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID

58. Queries General Efﬁcient SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID

59. Queries General Efﬁcient SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID Natural

60. Queries General Efﬁcient SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID Natural Flexible

61. Queries

62. Queries Which students are male? Which professors teach a course in room G010? Which courses have a project and are taken by female students?

63. Queries ID Name Age Sex Which students are male? 1 3 Marcel Konstantinopel 40 12 M M 5 Vital 56 M ID Name Age Title Which professors teach a course in room G010? 2 Gobelijn 65 Prof. dr. Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y

64. Queries ID Name Age Sex Which students are male? 1 3 Marcel Konstantinopel 40 12 M M 5 Vital 56 M ID Name Age Title Which professors teach a course in room G010? 2 Gobelijn 65 Prof. dr. Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y

65. Frequent Queries ID Name Age Sex Which students are male? 1 3 Marcel Konstantinopel 40 12 M M 5 Vital 56 M ID Name Age Title Which professors teach a course in room G010? 2 Gobelijn 65 Prof. dr. Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y

66. Frequent Queries Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y

67. Frequent Queries ID Name SP Room Project Which courses have a project? 1 3 4 Databases AI XML 60 60 30 G010 G005 G005 Y Y Y Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y

68. Frequent Queries ID Name SP Room Project Which courses have a project? 1 3 4 Databases AI XML 60 60 30 G010 G005 G005 Y Y Y Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y

69. Frequent Queries 66% of courses with a project are taken by female students ID Name SP Room Project Which courses have a project? 1 3 4 Databases AI XML 60 60 30 G010 G005 G005 Y Y Y Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y

70. Contained Frequent Queries 66% of courses with a project are taken by female students ID Name SP Room Project Which courses have a project? 1 3 4 Databases AI XML 60 60 30 G010 G005 G005 Y Y Y Which courses have a project and ID 1 Name Databases SP 60 Room G010 Project Y are taken by female students? 4 XML 30 G005 Y

71. pairs of contained frequent queries

72. relational data mining relational pairs of contained data frequent queries

73. Conqueror Algorithm relational pairs of contained data frequent queries

74. Conqueror Algorithm

75. Conqueror Algorithm Generate queries

76. Conqueror Algorithm Generate queries Evaluate queries

77. Conqueror Algorithm Generate queries Evaluate queries Pair queries

78. Conqueror Algorithm Generate queries

79. Conqueror Algorithm Generate queries Simple Conjunctive Queries

80. Conqueror Algorithm Generate queries Simple Conjunctive Queries A=B

81. Conqueror Algorithm Generate queries Simple Conjunctive Queries A=B A>B

82. Conqueror Algorithm Generate queries Simple Conjunctive Queries A=B R×1 A>B

83. Conqueror Algorithm Generate queries Simple Conjunctive Queries A=B R×1 A>B R,R

84. Conqueror Algorithm Generate queries

85. Conqueror Algorithm Generate queries SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID

86. Conqueror Algorithm Generate queries ⋈ Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID

87. Conqueror Algorithm Generate queries ⋈ Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID π SELECT DISTINCT Course.ID SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID

88. Conqueror Algorithm Generate queries ⋈ Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID π SELECT DISTINCT Course.ID σ Course.project = ‘Y’ AND Student.sex = ‘F’ SELECT DISTINCT Course.ID FROM Course, Takes, Student WHERE Course.project = ‘Y’ AND Student.sex = ‘F’ AND Student.ID = Takes.StudentID AND Course.ID = Takes.CourseID

89. Conqueror Algorithm Generate queries Evaluate queries Pair queries

90. Conqueror Algorithm Generate queries Evaluate queries Pair queries

91. Conqueror Algorithm Generate queries Evaluate queries Pair queries

92. Conqueror Algorithm Generate queries Evaluate queries Pair queries

93. Conqueror Algorithm Generate queries Evaluate queries Pair queries

94. Conqueror Algorithm Generate queries Evaluate queries Pair queries

95.

96.

97.

98.

99. The number of players that play a quiz they made themselves?

100. The number of players that play a quiz they made themselves and got the maximum score? The number of players that play a quiz they made themselves?

101. The number of players that play a quiz they made themselves and got the maximum score? ≠ The number of players that play a quiz they made themselves?

102. The number of players that play a quiz they made themselves and got the maximum score? = 86% of The number of players that play a quiz they made themselves?

103. The number of players that play a quiz they made themselves and got the maximum score? = 86% of The number of players that play a quiz they made themselves? 14% of the players do not maximal get a score on a quiz they made themselves

104.

105. The number of quizzes that are played?

106. The number of quizzes that are played in 2006? The number of quizzes that are played?

107. The number of quizzes that are played in 2006? = 91% of The number of quizzes that are played?

108. The number of quizzes that are played in 2006? = 91% of The number of quizzes that are played? majorityof the quizzes were played in 2006

109.

110. The number of players?

111. The number of players that play a quiz that exists? The number of players?

112. The number of players that play a quiz that exists? ≠ The number of players?

113. The number of players that play a quiz that exists? = 99% of The number of players?

114. The number of players that play a quiz that exists? = 99% of The number of players? 1% of the players play a quiz that does notexist

115. Queries Itemsets

116. Queries Itemsets

117. Queries Itemsets

118. Itemsets

119. Itemsets

120. Itemsets frequent itemset mining

121. Itemsets frequent itemset mining

122. Itemsets

123. Itemsets Market Baskets ID Bread Butter Cheese Wine 1 Y Y N N 2 Y N Y N 3 Y N Y Y 4 Y Y Y Y 5 Y N N N 6 Y N Y Y 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y

124. Itemsets Market Baskets ID 1 Bread Y Butter Y Cheese N Wine N frequent 2 Y N Y N itemset mining 3 Y N Y Y 4 Y Y Y Y 5 Y N N N 6 Y N Y Y 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y

125. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset mining 3 Y N Y Y 4 Y Y Y Y 5 Y N N N 6 Y N Y Y 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y

126. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} mining 3 Y N Y Y 4 Y Y Y Y 5 Y N N N 6 Y N Y Y 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y

127. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 Y N N N 6 Y N Y Y 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y

128. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y

129. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y

130. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y 12 N N Y Y

131. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y

132. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12}

133. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50%

134. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50%

135. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50%

136. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50%

137. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50% {(Cheese=Y)} ➔ {(Cheese=Y),(Wine=Y)} 6/8 = 75%

138. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50% {(Cheese=Y)} ➔ {(Cheese=Y),(Wine=Y)} 6/8 = 75% {(Wine=Y)} ➔ {(Cheese=Y),(Wine=Y)} 6/6 = 100%

139. Itemsets Market Baskets ID Bread Butter Cheese Wine frequent {(Cheese=Y)} 1 Y Y N N 2 Y N Y N itemset {2,3,4,6,7,9,11,12} 8/12 = 67% mining 3 Y N Y Y 4 Y Y Y Y 5 6 Y Y N N N Y N Y {(Wine=Y)} {3,4,6,9,11,12} 6/12 = 50% 7 Y Y Y N 8 N N N N 9 N Y Y Y 10 N Y N N 11 Y N Y Y {(Cheese=Y), (Wine=Y)} 12 N N Y Y {3,4,6,9,11,12} 6/12 = 50% {(Cheese=Y)} ➔ {(Cheese=Y),(Wine=Y)} 6/8 = 75% {(Wine=Y)} ➔ {(Cheese=Y),(Wine=Y)} 6/6 = 100% association rules

140. Itemsets

141. Itemsets Student ID Name Age Sex 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M 4 Charlotte 40 F 5 Vital 56 M

142. Itemsets Course ID Name SP Room Project 1 Databases 60 G010 Y Student 2 Data Mining 30 G005 N 3 AI 60 G005 Y ID Name Age Sex 4 XML 30 G005 Y 1 Marcel 40 M 2 Fanny 19 F 3 Konstantinopel 12 M Professor 4 Charlotte 40 F ID Name Age Title 5 Vital 56 M 1 Barabas 65 Prof. dr. 2 Gobelijn 65 Prof. dr. 3 Adhemar 10 Prof. dr.

143. Itemsets Course Takes ID Name SP Room Project Student.ID Course.ID 1 Databases 60 G010 Y Student Teaches 1 1 2 Data Mining 30 G005 N ID Name Age Sex Prof.ID Course.ID 1 3 3 AI 60 G005 Y 4 XML 30 G005 Y 1 Marcel 40 M 1 2 2 2 2 Fanny 19 F 1 3 2 4 3 Konstantinopel 12 M 2 1 3 1 Professor 4 Charlotte 40 F 2 4 3 2 ID Name Age Title 5 Vital 56 M 3 4 3 3 1 Barabas 65 Prof. dr. 3 4 2 Gobelijn 65 Prof. dr. 4 1 3 Adhemar 10 Prof. dr. 5 3

144. Itemsets Course Takes ID Name SP Room Project Student.ID Course.ID 1 Databases 60 G010 Y Student Teaches 1 1 2 Data Mining 30 G005 N ID Name Age Sex Prof.ID Course.ID 1 3 3 AI 60 G005 Y 4 XML 30 G005 Y 1 Marcel 40 M 1 2 2 2 2 Fanny 19 F 1 3 2 4 3 Konstantinopel 12 M 2 1 3 1 Professor 4 Charlotte 40 F 2 4 3 2 ID Name Age Title 5 Vital 56 M 3 4 3 3 1 Barabas 65 Prof. dr. 3 4 2 Gobelijn 65 Prof. dr. 4 1 3 Adhemar 10 Prof. dr. 5 3

145. Itemsets Course Takes ID Name SP Room Project Student.ID Course.ID 1 Databases 60 G010 Y Student Teaches 1 1 2 Data Mining 30 G005 N ID Name Age Sex Prof.ID Course.ID 1 3 3 AI 60 G005 Y 4 XML 30 G005 Y 1 Marcel 40 M 1 2 2 2 2 Fanny 19 F 1 3 2 4 3 Konstantinopel 12 M 2 1 3 1 Professor 4 Charlotte 40 F 2 4 3 2 ID Name Age Title 5 Vital 56 M 3 4 3 3 1 Barabas 65 Prof. dr. 3 4 2 Gobelijn 65 Prof. dr. 4 1 3 Adhemar 10 Prof. dr. 5 3

146. Itemsets Full Outer Join S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.

147. Itemsets Full Outer Join S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.

148. Itemsets Full Outer Join S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. frequent itemset mining

149. Itemsets Full Outer Join S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. frequent itemset mining {(project=Y)} 12/14 = 86%

150. Itemsets Full Outer Join S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. frequent itemset mining {(project=Y)} 12/14 = 86% of ?

151. Itemsets Full Outer Join S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. ✘ frequency has no clear meaning

152. The Key Idea

153. The Key Idea

154. The Key Idea Student Professor ID Name Age Sex ID Name Age Title 1 Marcel 40 M 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 5 Vital 56 M Course ID Name SP Room Project 1 Databases 60 G010 Y 2 Data Mining 30 G005 N 3 AI 60 G005 Y 4 XML 30 G005 Y

155. The Key Idea Student Professor ID Name Age Sex ID Name Age Title 1 Marcel 40 M 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 5 Vital 56 M Course ID Name SP Room Project 1 Databases 60 G010 Y 2 Data Mining 30 G005 N 3 AI 60 G005 Y 4 XML 30 G005 Y

156. The Key Idea Student Professor ID Name Age Sex ID Name Age Title 1 Marcel 40 M 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 5 Vital 56 M Course ID Name SP Room Project 1 Databases 60 G010 Y 2 Data Mining 30 G005 N 3 AI 60 G005 Y 4 XML 30 G005 Y

157. The Key Idea Student Professor ID Name Age Sex ID Name Age Title 1 Marcel 40 M 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 5 Vital 56 M Course ID Name SP Room Project 1 Databases 60 G010 Y 2 Data Mining 30 G005 N 3 AI 60 G005 Y 4 XML 30 G005 Y

158. The Key Idea S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.

159. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.

160. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr.

161. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, 4}

162. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, 4} of the 2/4 = 50% courses

163. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, 4} of the 2/4 = 50% courses

164. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, 4} of the 2/4 = 50% courses

165. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, {2, 3,4 4} } of the 2/4 = 50% courses

166. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, {2, 3,4 4} } of the 2/4 = 50% courses of the 3/5 = 60% students

167. The Key Idea {(SP=30)} S.ID Name Age Sex C.ID Name SP Room Project P.ID Name Age Title 1 Marcel 40 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 1 Marcel 40 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 2 Fanny 19 F 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 2 Fanny 19 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 3 Konstantinopel 12 M 1 Databases 60 G010 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 2 Data Mining 30 G005 N 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 3 Konstantinopel 12 M 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 4 Charlotte 40 F 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 2 Gobelijn 65 Prof. dr. 4 Charlotte 40 F 4 XML 30 G005 Y 3 Adhemar 10 Prof. dr. 5 Vital 56 M 3 AI 60 G005 Y 1 Barabas 65 Prof. dr. {2, {2, 3,4 4} } of the 2/4 = 50% courses of the 3/5 = 60% students

Editor's Notes

Goedenavond beste leden van de jury, collega's, vrienden, familie. Vandaag verdedig ik mijn proefschrift getiteld Mining Patterns in Relational Databases
Een eerste vraag die dan misschien bij jullie opkomt is, wat is dat, dat Mining. Wel, de meeste mensen weten wel wat gewone mijnbouw inhoud. Bij mijnbouw gaan we op een systematisch manier in de bodem of gesteente op zoek naar waardevolle materialen zoals erts, goud, mineralen of brandstoffen. De term data mining is dan ook gekozen naar analogie met dit proces.
Naar analogie met de bodem of gesteente beschouwen we als startpunt van ons mijnproces data. Data dat net zoals gesteente in grote hoeveelheden in de huidige wereld aanwezig is. We leven momenteel in een kennismaatschappij, en dankzij internet en een veelvoud aan digitale toestellen beschikken we over enorme hoeveelheden van data.
In deze grote hoeveelheden data, zit zoals in de rotsen bij industri&#xEB;le mijnbouw, iets waardevols verborgen. Dit waardevols is kennis. Nieuwe patronen waarvan we voorheen niet wisten dat ze golden. Maar net zoals bij industriele mijnbouw, is de hoeveelheid aan data te groot om manueel op zoek te gaan naar zulke patronen. We moeten het ook hier systematisch aanpakken.
Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
Deze systematische aanpak is het proces van kennis ontdekking. Hier zien we een schematische weergave van dit proces. We beschikken over data, hier opgeslagen in een database. Hiervan beschouwen we een stukje als invoer voor ons data mining algoritme. Dat zal resulteren in een set patronen, die we dan zullen evalueren en presenteren als nieuwe kennis. Deze kennis kan dan opnieuw in een database worden bewaard en zo terug de invoer vormen voor een nieuw proces van kennis ontdekking.
Ik zal dit proces even verduidelijken aan de hand van een voorbeeld. Een van eerste toepassingen van data mining was het analyseren van supermarktdatabases. Hierbij analyseren we de winkelkarretjes, oftewel, de verzamelingen van producten die klanten kopen.
Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo&#x2019;n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo&#x2019;n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo&#x2019;n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo&#x2019;n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo&#x2019;n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo&#x2019;n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo&#x2019;n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo&#x2019;n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo&#x2019;n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
Als we teruggaan naar met proces van kennis ontdekking is de concrete database hier de supermarktdatabase. Van deze database beschouwen de de winkelkarretjes van de klanten als invoer voor het data mining algoritme. Een algoritme dat hierop kan toegepast worden is een frequent itemset mining algoritme. We gaan in de winkelkarretjes van de klanten op zoek naar verzamelingen van producten die frequent tesamen worden gekocht. Dat zijn dan ook de patronen die het algoritme oplevert. Door deze te evalueren kunnen we hier kennis uit destilleren, zoals bijvoorbeeld het patroon dat 75% van de klanten die kaas kopen ook wijn kopen. Zo&#x2019;n informatie is interessant voor de winkelhouder die op basis hiervan promoties of de plaatsing van producten kan kiezen.
Dit lijkt eenvoudig. Maar neem even aan dat de supermarkt slechts 1000 producten verkoopt. De hoeveelheid mogelijke verzamelingen van producten is dan gelijk aan 2 tot de 1000ste. Dit is ongeveer gelijk aan 10 tot de 301ste oftwel een 1 met 301 nullen. Dit is een gigantische hoeveelheid. Meer zelfs
Dit lijkt eenvoudig. Maar neem even aan dat de supermarkt slechts 1000 producten verkoopt. De hoeveelheid mogelijke verzamelingen van producten is dan gelijk aan 2 tot de 1000ste. Dit is ongeveer gelijk aan 10 tot de 301ste oftwel een 1 met 301 nullen. Dit is een gigantische hoeveelheid. Meer zelfs
Dit lijkt eenvoudig. Maar neem even aan dat de supermarkt slechts 1000 producten verkoopt. De hoeveelheid mogelijke verzamelingen van producten is dan gelijk aan 2 tot de 1000ste. Dit is ongeveer gelijk aan 10 tot de 301ste oftwel een 1 met 301 nullen. Dit is een gigantische hoeveelheid. Meer zelfs
Dit lijkt eenvoudig. Maar neem even aan dat de supermarkt slechts 1000 producten verkoopt. De hoeveelheid mogelijke verzamelingen van producten is dan gelijk aan 2 tot de 1000ste. Dit is ongeveer gelijk aan 10 tot de 301ste oftwel een 1 met 301 nullen. Dit is een gigantische hoeveelheid. Meer zelfs
dit getal is groter dan het aantal atomen in het observeerbare universum. Immens veel dus. Het is dan ook onmogelijk om al deze verzamelingen even allemaal op te sommen en te controleren of ze vaak voorkomen.
We hebben dus een nood aan efficiente data mining algoritmes die wel in staat zijn om efficient de frequente of in het algemeen interessante patronen te vinden.
Dat was een korte samenvatting van wat data mining is. Maar mijn proefschrift behandeld het ontdekken van patronen in relationele databases. Wat is nu precies een relationele database? Laat ik dit ook illustreren aan de hand van een voorbeeld.
Aan deze universiteit geven professoren weel eens cursussen aan studenten. Deze informatie kunnen we ook opslaan in een relationele database.
We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
We kunnen alle informatie over professoren opslaan in een tabel. We kunnen dit ook voor de cursussen en de studenten. Dit zouden we een database kunnen noemen. Echter, deze verschillende elementen hebben ook onderlinge verbanden. Zo geven professoren namelijk bepaalde vakken wel en andere niet. Ook deze informatie kunnen we opslaan in een tabel in de database. Hetzelfde geld voor de Studenten die bepaalde vakken volgen. Op deze manier hebben we zowel de elementen als hun relaties bewaard in de database, en kunnen we spreken van een relationele database.
Terug naar het proces van kennis ontdekking dus, waar we dus nu relationele databases beschouwen als startpunt.
Terug naar het proces van kennis ontdekking dus, waar we dus nu relationele databases beschouwen als startpunt.
Terug naar het proces van kennis ontdekking dus, waar we dus nu relationele databases beschouwen als startpunt.
We hebben dus met andere woorden nood aan relationele data mining algoritmes, die gegeven relationele data, relationele patronen ontdekken.
We hebben dus met andere woorden nood aan relationele data mining algoritmes, die gegeven relationele data, relationele patronen ontdekken.
We hebben dus met andere woorden nood aan relationele data mining algoritmes, die gegeven relationele data, relationele patronen ontdekken.
We hebben dus met andere woorden nood aan relationele data mining algoritmes, die gegeven relationele data, relationele patronen ontdekken.
We hebben dus met andere woorden nood aan relationele data mining algoritmes, die gegeven relationele data, relationele patronen ontdekken.
Om zulke algoritmes te kunnen ontwikkelen moeten we eerst definieren wat wel als relationele patronen beschouwen. In mijn proefschrift beschouwen we twee types relationele patronen: queries en itemset
Om zulke algoritmes te kunnen ontwikkelen moeten we eerst definieren wat wel als relationele patronen beschouwen. In mijn proefschrift beschouwen we twee types relationele patronen: queries en itemset
Ik zal mij eerste toespitsen op het eerste type; queries. Wat zijn queries? Wel queries zijn niets anders dan vragen die je aan een database kan stellen. In het geval van de universteitsdatabase zou dit bvb kunnen zijn. Wie zijn de mannelijke studenten? OF Welke professoren geven een cursus in lokaal G010? OF Welke cursussen hebben een project en worden gevolgd door vrouwelijke studenten?
Ik zal mij eerste toespitsen op het eerste type; queries. Wat zijn queries? Wel queries zijn niets anders dan vragen die je aan een database kan stellen. In het geval van de universteitsdatabase zou dit bvb kunnen zijn. Wie zijn de mannelijke studenten? OF Welke professoren geven een cursus in lokaal G010? OF Welke cursussen hebben een project en worden gevolgd door vrouwelijke studenten?
Ik zal mij eerste toespitsen op het eerste type; queries. Wat zijn queries? Wel queries zijn niets anders dan vragen die je aan een database kan stellen. In het geval van de universteitsdatabase zou dit bvb kunnen zijn. Wie zijn de mannelijke studenten? OF Welke professoren geven een cursus in lokaal G010? OF Welke cursussen hebben een project en worden gevolgd door vrouwelijke studenten?
Neem nu bijvoorbeeld deze laatste query. Gegeven de relationele universiteitsdatabase, kunnen we deze vraag stellen. Dit gebeurd in de SQL taal, die speciaal werd ontwikkeld om relationele databases te ondervragen. Het stellen van deze vraag zal dan een resultaat opleveren dat ook in een tabelletje kan worden weergegeven. Hier zien we dan de cursussen die een project hebben en gevolgd worden door vrouwelijke studenten.
Neem nu bijvoorbeeld deze laatste query. Gegeven de relationele universiteitsdatabase, kunnen we deze vraag stellen. Dit gebeurd in de SQL taal, die speciaal werd ontwikkeld om relationele databases te ondervragen. Het stellen van deze vraag zal dan een resultaat opleveren dat ook in een tabelletje kan worden weergegeven. Hier zien we dan de cursussen die een project hebben en gevolgd worden door vrouwelijke studenten.
Neem nu bijvoorbeeld deze laatste query. Gegeven de relationele universiteitsdatabase, kunnen we deze vraag stellen. Dit gebeurd in de SQL taal, die speciaal werd ontwikkeld om relationele databases te ondervragen. Het stellen van deze vraag zal dan een resultaat opleveren dat ook in een tabelletje kan worden weergegeven. Hier zien we dan de cursussen die een project hebben en gevolgd worden door vrouwelijke studenten.
Neem nu bijvoorbeeld deze laatste query. Gegeven de relationele universiteitsdatabase, kunnen we deze vraag stellen. Dit gebeurd in de SQL taal, die speciaal werd ontwikkeld om relationele databases te ondervragen. Het stellen van deze vraag zal dan een resultaat opleveren dat ook in een tabelletje kan worden weergegeven. Hier zien we dan de cursussen die een project hebben en gevolgd worden door vrouwelijke studenten.
Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
Waarom zijn queries nu een goede manier om patronen in een relationele database te beschrijven? 1. zijn queries algemeen. We kunnen ze geformuleerd in SQL stellen aan het merendeel van de huidige bestaande relationele database systemen. 2. ze zijn efficient te evalueren omdat jaren van onderzoek zich hierop hebben toegespitst. Anderzijds zijn ze ook efficient te genereren door hun inherente structuur. Zoals eerder gezien is dit belangrijk vanuit het standpunt van data mining. 3. queries zijn een vertrouwd en natuurlijk concept voor gebruikers van relationele database. 4. queries zijn ook flexibel. Vele restricties en condities kunnen uitgedrukt worden in queries, wat toelaat om met behulp van queries ook specifiekere data mining settings uit te testen.
We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
We gaan even terug naar onze voorbeeld queries. We weten nu dat we met behulp van queries patronen kunnen uitdrukken, maar nu rijst de vraag: wanneer zijn deze patronen interessant? Hiervoor kijken we naar de resultaten. Als een query voldoende resultaten oplevert, dan beschouwen we deze als interessant. Als we bijvoorbeeld minimaal twee resultaten vereisen, valt de middelste query uit de boot. Queries die wel aan zeker minimum aan resultaten opleveren noemen we frequente queries. En het is deze queries waar we naar op zoek zullen gaan.
Maar een frequente query op zichzelf drukt nog niet meteen interessante kennis uit. Dit kunnen we echter verhelpen door twee queries tegelijk te beschouwen. Een specifiekere query en een algemenere. In dit voorbeeld kunnen we een algemenere versie van deze query beschouwen door enkel te vragen welke cursussen een project hebben. Het is duidelijk dat de cursussen met een project die ook gevolgd worden door vrouwelijk studenten hier een deelverzameling van vormen. Door deze dan te vergelijken zien we dat 2/3 of 66% van de curssusen met een project gevolgd worden door vrouwelijke studenten. Zulk een koppel van een specifiekere en een algemenere frequente query noemen we een koppel contained frequent queries. En dit zijn de patronen die we uiteindelijk willen ontdekken.
Maar een frequente query op zichzelf drukt nog niet meteen interessante kennis uit. Dit kunnen we echter verhelpen door twee queries tegelijk te beschouwen. Een specifiekere query en een algemenere. In dit voorbeeld kunnen we een algemenere versie van deze query beschouwen door enkel te vragen welke cursussen een project hebben. Het is duidelijk dat de cursussen met een project die ook gevolgd worden door vrouwelijk studenten hier een deelverzameling van vormen. Door deze dan te vergelijken zien we dat 2/3 of 66% van de curssusen met een project gevolgd worden door vrouwelijke studenten. Zulk een koppel van een specifiekere en een algemenere frequente query noemen we een koppel contained frequent queries. En dit zijn de patronen die we uiteindelijk willen ontdekken.
Maar een frequente query op zichzelf drukt nog niet meteen interessante kennis uit. Dit kunnen we echter verhelpen door twee queries tegelijk te beschouwen. Een specifiekere query en een algemenere. In dit voorbeeld kunnen we een algemenere versie van deze query beschouwen door enkel te vragen welke cursussen een project hebben. Het is duidelijk dat de cursussen met een project die ook gevolgd worden door vrouwelijk studenten hier een deelverzameling van vormen. Door deze dan te vergelijken zien we dat 2/3 of 66% van de curssusen met een project gevolgd worden door vrouwelijke studenten. Zulk een koppel van een specifiekere en een algemenere frequente query noemen we een koppel contained frequent queries. En dit zijn de patronen die we uiteindelijk willen ontdekken.
Maar een frequente query op zichzelf drukt nog niet meteen interessante kennis uit. Dit kunnen we echter verhelpen door twee queries tegelijk te beschouwen. Een specifiekere query en een algemenere. In dit voorbeeld kunnen we een algemenere versie van deze query beschouwen door enkel te vragen welke cursussen een project hebben. Het is duidelijk dat de cursussen met een project die ook gevolgd worden door vrouwelijk studenten hier een deelverzameling van vormen. Door deze dan te vergelijken zien we dat 2/3 of 66% van de curssusen met een project gevolgd worden door vrouwelijke studenten. Zulk een koppel van een specifiekere en een algemenere frequente query noemen we een koppel contained frequent queries. En dit zijn de patronen die we uiteindelijk willen ontdekken.
Maar een frequente query op zichzelf drukt nog niet meteen interessante kennis uit. Dit kunnen we echter verhelpen door twee queries tegelijk te beschouwen. Een specifiekere query en een algemenere. In dit voorbeeld kunnen we een algemenere versie van deze query beschouwen door enkel te vragen welke cursussen een project hebben. Het is duidelijk dat de cursussen met een project die ook gevolgd worden door vrouwelijk studenten hier een deelverzameling van vormen. Door deze dan te vergelijken zien we dat 2/3 of 66% van de curssusen met een project gevolgd worden door vrouwelijke studenten. Zulk een koppel van een specifiekere en een algemenere frequente query noemen we een koppel contained frequent queries. En dit zijn de patronen die we uiteindelijk willen ontdekken.
Maar een frequente query op zichzelf drukt nog niet meteen interessante kennis uit. Dit kunnen we echter verhelpen door twee queries tegelijk te beschouwen. Een specifiekere query en een algemenere. In dit voorbeeld kunnen we een algemenere versie van deze query beschouwen door enkel te vragen welke cursussen een project hebben. Het is duidelijk dat de cursussen met een project die ook gevolgd worden door vrouwelijk studenten hier een deelverzameling van vormen. Door deze dan te vergelijken zien we dat 2/3 of 66% van de curssusen met een project gevolgd worden door vrouwelijke studenten. Zulk een koppel van een specifiekere en een algemenere frequente query noemen we een koppel contained frequent queries. En dit zijn de patronen die we uiteindelijk willen ontdekken.
Om dit type patronen te ontdekken ontwikkelde we het Conqueror Algoritme.
Om dit type patronen te ontdekken ontwikkelde we het Conqueror Algoritme.
Om dit type patronen te ontdekken ontwikkelde we het Conqueror Algoritme.
Om dit type patronen te ontdekken ontwikkelde we het Conqueror Algoritme.
Om dit type patronen te ontdekken ontwikkelde we het Conqueror Algoritme.
Om dit type patronen te ontdekken ontwikkelde we het Conqueror Algoritme.
Het Conqueror algoritme bestaat grofweg uit drie onderdelen. Het genereren van queries. Het evalueren van queries en het koppelen van queries.
Het Conqueror algoritme bestaat grofweg uit drie onderdelen. Het genereren van queries. Het evalueren van queries en het koppelen van queries.
Het Conqueror algoritme bestaat grofweg uit drie onderdelen. Het genereren van queries. Het evalueren van queries en het koppelen van queries.
Laat ons eerst een kijken naar het genereren van queries. Alle mogelijke queries genereren is een erg complexe zaak. We hebben dan ook besloten om ons toe te spitsen op een specifiek type queries dat eenvoudig te genereren is maar toch voldoende krachtig is om interessante patronen mee te kunnen uitdrukken. Dit zijn de Simpele Conjunctieve Queries. De twee belangrijkste restricties van de simpele conjunctieve queries zijn: ten eerste dat enkel gelijkheden zijn toegestaan. We kunnen zodus vragen naar alle professoren met leeftijd van exact 65, maar niet naar alle professoren met een leeftijd van boven de 50. Ten tweede mag elke tabel of relatie slechts 1 maal voorkomen in de query. Dat wil dus zeggen dat we geen vraag kunnen genereren over studenten en hun relatie met andere studenten.
Laat ons eerst een kijken naar het genereren van queries. Alle mogelijke queries genereren is een erg complexe zaak. We hebben dan ook besloten om ons toe te spitsen op een specifiek type queries dat eenvoudig te genereren is maar toch voldoende krachtig is om interessante patronen mee te kunnen uitdrukken. Dit zijn de Simpele Conjunctieve Queries. De twee belangrijkste restricties van de simpele conjunctieve queries zijn: ten eerste dat enkel gelijkheden zijn toegestaan. We kunnen zodus vragen naar alle professoren met leeftijd van exact 65, maar niet naar alle professoren met een leeftijd van boven de 50. Ten tweede mag elke tabel of relatie slechts 1 maal voorkomen in de query. Dat wil dus zeggen dat we geen vraag kunnen genereren over studenten en hun relatie met andere studenten.
Laat ons eerst een kijken naar het genereren van queries. Alle mogelijke queries genereren is een erg complexe zaak. We hebben dan ook besloten om ons toe te spitsen op een specifiek type queries dat eenvoudig te genereren is maar toch voldoende krachtig is om interessante patronen mee te kunnen uitdrukken. Dit zijn de Simpele Conjunctieve Queries. De twee belangrijkste restricties van de simpele conjunctieve queries zijn: ten eerste dat enkel gelijkheden zijn toegestaan. We kunnen zodus vragen naar alle professoren met leeftijd van exact 65, maar niet naar alle professoren met een leeftijd van boven de 50. Ten tweede mag elke tabel of relatie slechts 1 maal voorkomen in de query. Dat wil dus zeggen dat we geen vraag kunnen genereren over studenten en hun relatie met andere studenten.
Laat ons eerst een kijken naar het genereren van queries. Alle mogelijke queries genereren is een erg complexe zaak. We hebben dan ook besloten om ons toe te spitsen op een specifiek type queries dat eenvoudig te genereren is maar toch voldoende krachtig is om interessante patronen mee te kunnen uitdrukken. Dit zijn de Simpele Conjunctieve Queries. De twee belangrijkste restricties van de simpele conjunctieve queries zijn: ten eerste dat enkel gelijkheden zijn toegestaan. We kunnen zodus vragen naar alle professoren met leeftijd van exact 65, maar niet naar alle professoren met een leeftijd van boven de 50. Ten tweede mag elke tabel of relatie slechts 1 maal voorkomen in de query. Dat wil dus zeggen dat we geen vraag kunnen genereren over studenten en hun relatie met andere studenten.
Laat ons eerst een kijken naar het genereren van queries. Alle mogelijke queries genereren is een erg complexe zaak. We hebben dan ook besloten om ons toe te spitsen op een specifiek type queries dat eenvoudig te genereren is maar toch voldoende krachtig is om interessante patronen mee te kunnen uitdrukken. Dit zijn de Simpele Conjunctieve Queries. De twee belangrijkste restricties van de simpele conjunctieve queries zijn: ten eerste dat enkel gelijkheden zijn toegestaan. We kunnen zodus vragen naar alle professoren met leeftijd van exact 65, maar niet naar alle professoren met een leeftijd van boven de 50. Ten tweede mag elke tabel of relatie slechts 1 maal voorkomen in de query. Dat wil dus zeggen dat we geen vraag kunnen genereren over studenten en hun relatie met andere studenten.
Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
Hoe hebben we deze generatie van queries aangepakt? Wel het is zo dat simpele conjunctieve queries eigenlijk opgebouwd kunnen worden aan de hand van drie onderdelen. Ten eerste is er de join, die beschrijft welke entiteiten aan welke andere entiteiten gekoppeld zijn en hoe. In dit voorbeeld studenten en cursussen. Ten tweede is er de projectie, die beschrijft welk het element is waar de vraag over gaat. In dit voorbeeldje cursussen. En ten derde de selectie, die de specifieke aspecten van de vraag bevat. In dit voorbeeld het feit dat de cursussen een project moeten hebben en dat de studenten vrouwelijk moeten zijn.Deze drie onderdelen genereren we in het Conqueror Algoritme dus elks efficient en op een unieke manier, maar ik zal hier verder niet in detail treden.
Dat was dus de generatie. Omdat we queries genereren is de evaluatie betrekkelijk voor de hand liggend. We stellen deze gewoon in SQL aan de relationele database. We hebben echter in het algoritme enkele aspecten toegevoegd om dit nog efficienter te doen gebeuren, maar ook hier ga ik niet in detail op in. Het laatste aspect is het koppelen van queries. Omwille van ons specifiek patroontype, de simpele conjunctieve queries, kunnen we ook dit koppelen van queries efficient uitvoeren, maar ook hier zal ik nier verder over uitweiden. In plaats daarvan laat ik jullie enkele voorbeelden zien van patronen die we met het Conqueror Algoritme hebben kunnen ontdekken.
Dat was dus de generatie. Omdat we queries genereren is de evaluatie betrekkelijk voor de hand liggend. We stellen deze gewoon in SQL aan de relationele database. We hebben echter in het algoritme enkele aspecten toegevoegd om dit nog efficienter te doen gebeuren, maar ook hier ga ik niet in detail op in. Het laatste aspect is het koppelen van queries. Omwille van ons specifiek patroontype, de simpele conjunctieve queries, kunnen we ook dit koppelen van queries efficient uitvoeren, maar ook hier zal ik nier verder over uitweiden. In plaats daarvan laat ik jullie enkele voorbeelden zien van patronen die we met het Conqueror Algoritme hebben kunnen ontdekken.
Dat was dus de generatie. Omdat we queries genereren is de evaluatie betrekkelijk voor de hand liggend. We stellen deze gewoon in SQL aan de relationele database. We hebben echter in het algoritme enkele aspecten toegevoegd om dit nog efficienter te doen gebeuren, maar ook hier ga ik niet in detail op in. Het laatste aspect is het koppelen van queries. Omwille van ons specifiek patroontype, de simpele conjunctieve queries, kunnen we ook dit koppelen van queries efficient uitvoeren, maar ook hier zal ik nier verder over uitweiden. In plaats daarvan laat ik jullie enkele voorbeelden zien van patronen die we met het Conqueror Algoritme hebben kunnen ontdekken.
Dat was dus de generatie. Omdat we queries genereren is de evaluatie betrekkelijk voor de hand liggend. We stellen deze gewoon in SQL aan de relationele database. We hebben echter in het algoritme enkele aspecten toegevoegd om dit nog efficienter te doen gebeuren, maar ook hier ga ik niet in detail op in. Het laatste aspect is het koppelen van queries. Omwille van ons specifiek patroontype, de simpele conjunctieve queries, kunnen we ook dit koppelen van queries efficient uitvoeren, maar ook hier zal ik nier verder over uitweiden. In plaats daarvan laat ik jullie enkele voorbeelden zien van patronen die we met het Conqueror Algoritme hebben kunnen ontdekken.
Dat was dus de generatie. Omdat we queries genereren is de evaluatie betrekkelijk voor de hand liggend. We stellen deze gewoon in SQL aan de relationele database. We hebben echter in het algoritme enkele aspecten toegevoegd om dit nog efficienter te doen gebeuren, maar ook hier ga ik niet in detail op in. Het laatste aspect is het koppelen van queries. Omwille van ons specifiek patroontype, de simpele conjunctieve queries, kunnen we ook dit koppelen van queries efficient uitvoeren, maar ook hier zal ik nier verder over uitweiden. In plaats daarvan laat ik jullie enkele voorbeelden zien van patronen die we met het Conqueror Algoritme hebben kunnen ontdekken.
De database uit dit experiment is de database van een Quiz website. Bij zulke een quiz krijg je negen vragen. En op het einde krijg je dan een score op negen toegewezen.
De database uit dit experiment is de database van een Quiz website. Bij zulke een quiz krijg je negen vragen. En op het einde krijg je dan een score op negen toegewezen.
We vonden het volgende koppel frequente queries. De eerste query vraag Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt. De tweede query vraagt Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt en hierbij bovendien de maximum score behaalden. Tegen de verwachtingen in zien we echter dat dit niet hetzelfde is. Het resultaat van de bovenste query is 86% van het resultaat van de onderste. We vinden het interessante patroon dat 14% van de spelers niet de maximum score behalen op een quiz die ze zelf hebben gemaakt.
We vonden het volgende koppel frequente queries. De eerste query vraag Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt. De tweede query vraagt Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt en hierbij bovendien de maximum score behaalden. Tegen de verwachtingen in zien we echter dat dit niet hetzelfde is. Het resultaat van de bovenste query is 86% van het resultaat van de onderste. We vinden het interessante patroon dat 14% van de spelers niet de maximum score behalen op een quiz die ze zelf hebben gemaakt.
We vonden het volgende koppel frequente queries. De eerste query vraag Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt. De tweede query vraagt Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt en hierbij bovendien de maximum score behaalden. Tegen de verwachtingen in zien we echter dat dit niet hetzelfde is. Het resultaat van de bovenste query is 86% van het resultaat van de onderste. We vinden het interessante patroon dat 14% van de spelers niet de maximum score behalen op een quiz die ze zelf hebben gemaakt.
We vonden het volgende koppel frequente queries. De eerste query vraag Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt. De tweede query vraagt Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt en hierbij bovendien de maximum score behaalden. Tegen de verwachtingen in zien we echter dat dit niet hetzelfde is. Het resultaat van de bovenste query is 86% van het resultaat van de onderste. We vinden het interessante patroon dat 14% van de spelers niet de maximum score behalen op een quiz die ze zelf hebben gemaakt.
We vonden het volgende koppel frequente queries. De eerste query vraag Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt. De tweede query vraagt Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt en hierbij bovendien de maximum score behaalden. Tegen de verwachtingen in zien we echter dat dit niet hetzelfde is. Het resultaat van de bovenste query is 86% van het resultaat van de onderste. We vinden het interessante patroon dat 14% van de spelers niet de maximum score behalen op een quiz die ze zelf hebben gemaakt.
We vonden het volgende koppel frequente queries. De eerste query vraag Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt. De tweede query vraagt Het aantal spelers dat een quiz speelt die ze zelf hebben gemaakt en hierbij bovendien de maximum score behaalden. Tegen de verwachtingen in zien we echter dat dit niet hetzelfde is. Het resultaat van de bovenste query is 86% van het resultaat van de onderste. We vinden het interessante patroon dat 14% van de spelers niet de maximum score behalen op een quiz die ze zelf hebben gemaakt.
We vonden ook het volgende koppel frequente queries. Als we het totale aantal quizzen vergelijken met het aantal quizzen gespeeld in 2006, zien we dat die 91% is. Met andere woorden we vinden het patroon dat in 2006 de meerderheid van de quizzen gespeeld werd.
We vonden ook het volgende koppel frequente queries. Als we het totale aantal quizzen vergelijken met het aantal quizzen gespeeld in 2006, zien we dat die 91% is. Met andere woorden we vinden het patroon dat in 2006 de meerderheid van de quizzen gespeeld werd.
We vonden ook het volgende koppel frequente queries. Als we het totale aantal quizzen vergelijken met het aantal quizzen gespeeld in 2006, zien we dat die 91% is. Met andere woorden we vinden het patroon dat in 2006 de meerderheid van de quizzen gespeeld werd.
We vonden ook het volgende koppel frequente queries. Als we het totale aantal quizzen vergelijken met het aantal quizzen gespeeld in 2006, zien we dat die 91% is. Met andere woorden we vinden het patroon dat in 2006 de meerderheid van de quizzen gespeeld werd.
We vonden ook het volgende koppel frequente queries. We vergelijken het totaal aantal spelers met het totale aantal spelers die een quiz spelen die bestaat. Die bovenste query is niet meteen een query die we uit onszelf zouden stellen omdat we zouden verwachten dat die gelijk is aan de onderste. Dit is echter niet waar, het aantal is slechts 99%. We kunnen dus besluiten dat 1% van de spelers een quiz speelt die niet bestaat. Een bizar patroon dat enkel maar kan voorkomen als er fouten in de database zitten. Maar net daarom is het interessant, omdat we zo zulke fouten kunnen ontdekken, en ze verbeteren.
We vonden ook het volgende koppel frequente queries. We vergelijken het totaal aantal spelers met het totale aantal spelers die een quiz spelen die bestaat. Die bovenste query is niet meteen een query die we uit onszelf zouden stellen omdat we zouden verwachten dat die gelijk is aan de onderste. Dit is echter niet waar, het aantal is slechts 99%. We kunnen dus besluiten dat 1% van de spelers een quiz speelt die niet bestaat. Een bizar patroon dat enkel maar kan voorkomen als er fouten in de database zitten. Maar net daarom is het interessant, omdat we zo zulke fouten kunnen ontdekken, en ze verbeteren.
We vonden ook het volgende koppel frequente queries. We vergelijken het totaal aantal spelers met het totale aantal spelers die een quiz spelen die bestaat. Die bovenste query is niet meteen een query die we uit onszelf zouden stellen omdat we zouden verwachten dat die gelijk is aan de onderste. Dit is echter niet waar, het aantal is slechts 99%. We kunnen dus besluiten dat 1% van de spelers een quiz speelt die niet bestaat. Een bizar patroon dat enkel maar kan voorkomen als er fouten in de database zitten. Maar net daarom is het interessant, omdat we zo zulke fouten kunnen ontdekken, en ze verbeteren.
We vonden ook het volgende koppel frequente queries. We vergelijken het totaal aantal spelers met het totale aantal spelers die een quiz spelen die bestaat. Die bovenste query is niet meteen een query die we uit onszelf zouden stellen omdat we zouden verwachten dat die gelijk is aan de onderste. Dit is echter niet waar, het aantal is slechts 99%. We kunnen dus besluiten dat 1% van de spelers een quiz speelt die niet bestaat. Een bizar patroon dat enkel maar kan voorkomen als er fouten in de database zitten. Maar net daarom is het interessant, omdat we zo zulke fouten kunnen ontdekken, en ze verbeteren.
We vonden ook het volgende koppel frequente queries. We vergelijken het totaal aantal spelers met het totale aantal spelers die een quiz spelen die bestaat. Die bovenste query is niet meteen een query die we uit onszelf zouden stellen omdat we zouden verwachten dat die gelijk is aan de onderste. Dit is echter niet waar, het aantal is slechts 99%. We kunnen dus besluiten dat 1% van de spelers een quiz speelt die niet bestaat. Een bizar patroon dat enkel maar kan voorkomen als er fouten in de database zitten. Maar net daarom is het interessant, omdat we zo zulke fouten kunnen ontdekken, en ze verbeteren.
We vonden ook het volgende koppel frequente queries. We vergelijken het totaal aantal spelers met het totale aantal spelers die een quiz spelen die bestaat. Die bovenste query is niet meteen een query die we uit onszelf zouden stellen omdat we zouden verwachten dat die gelijk is aan de onderste. Dit is echter niet waar, het aantal is slechts 99%. We kunnen dus besluiten dat 1% van de spelers een quiz speelt die niet bestaat. Een bizar patroon dat enkel maar kan voorkomen als er fouten in de database zitten. Maar net daarom is het interessant, omdat we zo zulke fouten kunnen ontdekken, en ze verbeteren.
Goed, hiermee besluiten we queries als relationeel patroontype. Het tweede patroontype dat in mijn proefwerk wordt beschouwd zijn itemsets.
Goed, hiermee besluiten we queries als relationeel patroontype. Het tweede patroontype dat in mijn proefwerk wordt beschouwd zijn itemsets.
Goed, hiermee besluiten we queries als relationeel patroontype. Het tweede patroontype dat in mijn proefwerk wordt beschouwd zijn itemsets.
We zagen itemsets al helemaal in het begin van deze presentatie, toen we het hadden over winkelkarretjes. Hierop voerden we frequent itemset mining uit om zo tot verzamelingen te komen van frequent samen gekochte producten. Laat ons nu even kijk hoe dat in zijn werk gaat.
We zagen itemsets al helemaal in het begin van deze presentatie, toen we het hadden over winkelkarretjes. Hierop voerden we frequent itemset mining uit om zo tot verzamelingen te komen van frequent samen gekochte producten. Laat ons nu even kijk hoe dat in zijn werk gaat.
We zagen itemsets al helemaal in het begin van deze presentatie, toen we het hadden over winkelkarretjes. Hierop voerden we frequent itemset mining uit om zo tot verzamelingen te komen van frequent samen gekochte producten. Laat ons nu even kijk hoe dat in zijn werk gaat.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
De winkelkarretjes kunnen in een enkele tabel worden bewaard. We hebben hier dus niet te maken met een relationele database. Als we frequent itemset mining toepassing kunnen we bijvoorbeeld de volgende patronen vinden: het patroon &#x201C;kaas komt voor in het karretje&#x201D;, is waar voor de karretjes 2,3,4,6,7,9,11,12. 8 van de 12 karretjes dus of met andere woorden in 67% van de gevallen &#x201C;wijn&#x201D; komt voor in de karretjes 3,4,6,9,11 en 12, dus 6 van de 12 karretjes of 50%. kaas en wijn tesamen komt ook in 6 van 12 karretjes voor. Net zoals bij de queries, kunnen we ook hier een itemset en een specifiekere itemset vergelijken. Als we bijvoorbeeld kijken naar kaas en dan naar kaas en wijn, zien we dat van de 8 gevallen waarin kaas gekocht word er in 6 daarvan ook wijn gekocht wordt. Of ook in 75% van de gevallen koopt iemand die kaas koopt ook wijn. Andersom als we kijken naar de mensen die wijn kopen zien we dat die in alle gevallen ook kaas kopen. Zulke patronen worden ook wel associatie regels genoemd omdat ze een verband tussen productensets weergeven.
Nu, zoals gezegd 1 tabel is geen relationele database. In een relationele database hebben we meer tabellen. Gelukkig zijn er ook relaties die de verbindingen tussen deze tabellen beschrijven.
Nu, zoals gezegd 1 tabel is geen relationele database. In een relationele database hebben we meer tabellen. Gelukkig zijn er ook relaties die de verbindingen tussen deze tabellen beschrijven.
Nu, zoals gezegd 1 tabel is geen relationele database. In een relationele database hebben we meer tabellen. Gelukkig zijn er ook relaties die de verbindingen tussen deze tabellen beschrijven.
Nu, zoals gezegd 1 tabel is geen relationele database. In een relationele database hebben we meer tabellen. Gelukkig zijn er ook relaties die de verbindingen tussen deze tabellen beschrijven.
Nu, zoals gezegd 1 tabel is geen relationele database. In een relationele database hebben we meer tabellen. Gelukkig zijn er ook relaties die de verbindingen tussen deze tabellen beschrijven.
Op die manier kunnen we van deze verschillende tabellen...
Op die manier kunnen we van deze verschillende tabellen...
Op die manier kunnen we van deze verschillende tabellen...
Op die manier kunnen we van deze verschillende tabellen...
... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
... een enkele tabel maken. Dit gebeurd met behulp van een full outer join. Nu we terug 1 tabel hebben kunnen we eenvoudigweg terug itemset mining toepassen en vinden we bijvoorbeeld het patroon project = ja dat geldt voor 12 van de 14 of 86% van ... en hier zit nu net het probleem, 86% van wat? Door op deze tabel gewoon frequent itemset mining toe te passen heeft frequentie geen duidelijke betekenis meer.
Daarom kwamen we met het volgende sleutel of key idee.
In een relationele databank is het typisch dat elke tabel een unieke sleutel of key heeft gedefinieerd die toelaat om op een unieke manier naar elementen van zulk een tabel te verwijzen. We kunnen dus om frequentie van itemsets te bepalen deze unieke sleutels gaan tellen.
In een relationele databank is het typisch dat elke tabel een unieke sleutel of key heeft gedefinieerd die toelaat om op een unieke manier naar elementen van zulk een tabel te verwijzen. We kunnen dus om frequentie van itemsets te bepalen deze unieke sleutels gaan tellen.
In een relationele databank is het typisch dat elke tabel een unieke sleutel of key heeft gedefinieerd die toelaat om op een unieke manier naar elementen van zulk een tabel te verwijzen. We kunnen dus om frequentie van itemsets te bepalen deze unieke sleutels gaan tellen.
In een relationele databank is het typisch dat elke tabel een unieke sleutel of key heeft gedefinieerd die toelaat om op een unieke manier naar elementen van zulk een tabel te verwijzen. We kunnen dus om frequentie van itemsets te bepalen deze unieke sleutels gaan tellen.
In een relationele databank is het typisch dat elke tabel een unieke sleutel of key heeft gedefinieerd die toelaat om op een unieke manier naar elementen van zulk een tabel te verwijzen. We kunnen dus om frequentie van itemsets te bepalen deze unieke sleutels gaan tellen.
In een relationele databank is het typisch dat elke tabel een unieke sleutel of key heeft gedefinieerd die toelaat om op een unieke manier naar elementen van zulk een tabel te verwijzen. We kunnen dus om frequentie van itemsets te bepalen deze unieke sleutels gaan tellen.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Laten we dit even demonstreren aan de hand van het volgende voorbeeld. Het patroon 30 studiepunten komt verschillende keren in de full outer join voor. Nu gaan we echter naar de sleutels kijken. Als we kijken naar cursussen zien we dat dit voorkomt voor sleutel 2 en 4, wat neerkomt op 2 van de 4 cursussen of 50%. We hebben dus het patroon dat 50% van de cursussen 30 studiepunten waard is. Als we echter kijken naar studenten, dan zien we dat dit overeenkomt met de sleutels 2,3 en 4. Maw, 3 van de 5 of 60% van de studenten volgt een vak van 30 studiepunten. Ten laatste kunnen we ook professoren bekijken, hier zien we dat we sleutels 1,2 en 3 krijgen, maw alle professoren geven een van van 30 studiepunten.
Het is duidelijk dat frequentie nu terug een duidelijk betekenis heeft. Dit soort patronen, noemen we relationele itemsets.
Het is duidelijk dat frequentie nu terug een duidelijk betekenis heeft. Dit soort patronen, noemen we relationele itemsets.
Het is duidelijk dat frequentie nu terug een duidelijk betekenis heeft. Dit soort patronen, noemen we relationele itemsets.
Het is duidelijk dat frequentie nu terug een duidelijk betekenis heeft. Dit soort patronen, noemen we relationele itemsets.
Het is duidelijk dat frequentie nu terug een duidelijk betekenis heeft. Dit soort patronen, noemen we relationele itemsets.
Het is duidelijk dat frequentie nu terug een duidelijk betekenis heeft. Dit soort patronen, noemen we relationele itemsets.
Er is echter nog een resterend probleem. De join tabel die we gebruiken om onze patronen in te vinden is typisch erg groot. Zo groot dat deze te veel geheugen van de computer vereist, maar evenzeer te veel tijd om ze op te stellen Er is dus nood aan een efficient algoritme op dit probleem aan te pakken.
Er is echter nog een resterend probleem. De join tabel die we gebruiken om onze patronen in te vinden is typisch erg groot. Zo groot dat deze te veel geheugen van de computer vereist, maar evenzeer te veel tijd om ze op te stellen Er is dus nood aan een efficient algoritme op dit probleem aan te pakken.
Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
Hiervoor hebben wij het SMuRFIG algoritme ontwikkel.SMuRFIG staat voor Simple Multi-Relational Frequent Itemset Generator.
Ik ga het SMuRFIG algoritme niet in volle detail uitleggen maar enkel twee van de belangrijkste concepten die het gebruikt en dat is intersectie EN propagatie
Ik ga het SMuRFIG algoritme niet in volle detail uitleggen maar enkel twee van de belangrijkste concepten die het gebruikt en dat is intersectie EN propagatie
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Laat ons beginnen met intersectie. Stel we focussen ons even enkel op studenten. Als we het patroon project=neen bekijken zien we dat dit voorkomt voor student 2 en 3 Het patroon geslacht = vrouwelijk voor student 2 en 4. Om te berekenen voor welke studenten het patroon project = neen EN geslacht = vrouwelijk voorkomt kunnen we de intersectie of doorsnede van deze twee verzamelingen nemen, en zo bekomen we enkel nog student 2.
Dat was ruwweg gezegd intersectie, de eerste basiscomponent van he SMuRFIG algoritme. De tweede component is propagatie.
Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
Propagatie zorgt ervoor dat we frequenties kunnen berekenen zonder de join tabel te constueren. Stel we hebben het patroon professor barabas en we willen weten welke studenten hier aan gelinkt zijn. Op basis van de relatie Teaches kunnen we nu het patroon professor barabas propageren naar curssussen.
en dan weer verder kunnen we met behulp van de relatie Takes deze cursussen propageren naar de studenten. Zo bekomen we dus dat studenten 1,2,3 en 5 gelinkt zijn aan professor barabas.
en dan weer verder kunnen we met behulp van de relatie Takes deze cursussen propageren naar de studenten. Zo bekomen we dus dat studenten 1,2,3 en 5 gelinkt zijn aan professor barabas.
en dan weer verder kunnen we met behulp van de relatie Takes deze cursussen propageren naar de studenten. Zo bekomen we dus dat studenten 1,2,3 en 5 gelinkt zijn aan professor barabas.
Dat is ruwweg genomen propagatie. Nu in ons voorbeeld defineerden we intersectie nog aan de hand van de join tabel, maar doordat propagatie zullen we deze echter niet berekenen. In het SMuRFIG algoritme ontwikkelde we echter een nieuwe manier om intersectie en propagatie te combineren om zo relationele itemsets te genereren. Op deze complexe integratie ga ik echter niet verder in, maar beschouw ik kort nog een experimenteel voorbeeld.
In de database van het departement wiskunde en informatica vonden we zo bijvoorbeeld het frequente patroon studenten in bachelor informatica. Door te kijken naar de verschillende sleutels vinden we zo dat 75 % vd studenten BINF stud zijn 68% van de profs een cursus geven aan BINF stud EN slecht 39% vd cursussen worden gevolgd door BINF studs.
In de database van het departement wiskunde en informatica vonden we zo bijvoorbeeld het frequente patroon studenten in bachelor informatica. Door te kijken naar de verschillende sleutels vinden we zo dat 75 % vd studenten BINF stud zijn 68% van de profs een cursus geven aan BINF stud EN slecht 39% vd cursussen worden gevolgd door BINF studs.
In de database van het departement wiskunde en informatica vonden we zo bijvoorbeeld het frequente patroon studenten in bachelor informatica. Door te kijken naar de verschillende sleutels vinden we zo dat 75 % vd studenten BINF stud zijn 68% van de profs een cursus geven aan BINF stud EN slecht 39% vd cursussen worden gevolgd door BINF studs.
In de database van het departement wiskunde en informatica vonden we zo bijvoorbeeld het frequente patroon studenten in bachelor informatica. Door te kijken naar de verschillende sleutels vinden we zo dat 75 % vd studenten BINF stud zijn 68% van de profs een cursus geven aan BINF stud EN slecht 39% vd cursussen worden gevolgd door BINF studs.
Hiermee besluiten we itemsets als patronen. Samengevat hebben we du Queries beschouwd als relationele patronen en hiervoor het Conqueror Algoritme ontwikkeld. We bestudeerden ook relationele itemsets en ontwikkelden hiervoor het efficient SMuRFIG algoritme. Aan beide algoritme zit echter ook hetzelfde nadeel dat bij vele andere data mining algoritmes is terug te vinden alleen maakt de relationele setting dit nog ietswat erger
Hiermee besluiten we itemsets als patronen. Samengevat hebben we du Queries beschouwd als relationele patronen en hiervoor het Conqueror Algoritme ontwikkeld. We bestudeerden ook relationele itemsets en ontwikkelden hiervoor het efficient SMuRFIG algoritme. Aan beide algoritme zit echter ook hetzelfde nadeel dat bij vele andere data mining algoritmes is terug te vinden alleen maakt de relationele setting dit nog ietswat erger
Hiermee besluiten we itemsets als patronen. Samengevat hebben we du Queries beschouwd als relationele patronen en hiervoor het Conqueror Algoritme ontwikkeld. We bestudeerden ook relationele itemsets en ontwikkelden hiervoor het efficient SMuRFIG algoritme. Aan beide algoritme zit echter ook hetzelfde nadeel dat bij vele andere data mining algoritmes is terug te vinden alleen maakt de relationele setting dit nog ietswat erger
Hiermee besluiten we itemsets als patronen. Samengevat hebben we du Queries beschouwd als relationele patronen en hiervoor het Conqueror Algoritme ontwikkeld. We bestudeerden ook relationele itemsets en ontwikkelden hiervoor het efficient SMuRFIG algoritme. Aan beide algoritme zit echter ook hetzelfde nadeel dat bij vele andere data mining algoritmes is terug te vinden alleen maakt de relationele setting dit nog ietswat erger
Hiermee besluiten we itemsets als patronen. Samengevat hebben we du Queries beschouwd als relationele patronen en hiervoor het Conqueror Algoritme ontwikkeld. We bestudeerden ook relationele itemsets en ontwikkelden hiervoor het efficient SMuRFIG algoritme. Aan beide algoritme zit echter ook hetzelfde nadeel dat bij vele andere data mining algoritmes is terug te vinden alleen maakt de relationele setting dit nog ietswat erger
Hiermee besluiten we itemsets als patronen. Samengevat hebben we du Queries beschouwd als relationele patronen en hiervoor het Conqueror Algoritme ontwikkeld. We bestudeerden ook relationele itemsets en ontwikkelden hiervoor het efficient SMuRFIG algoritme. Aan beide algoritme zit echter ook hetzelfde nadeel dat bij vele andere data mining algoritmes is terug te vinden alleen maakt de relationele setting dit nog ietswat erger
en dat is de patroon explosie. Een grote database levert een groot aantal patronen op. En we willen deze verzameling patronen natuurlijk enkel beperken tot diegene die we echt interessant vinden.
en dat is de patroon explosie. Een grote database levert een groot aantal patronen op. En we willen deze verzameling patronen natuurlijk enkel beperken tot diegene die we echt interessant vinden.
Zowel voor het Conqueror algoritme als voor het SMuRFIG algoritme bekeken we in ons proefschrift enkele oplossingen voor die ik slechts kort zal opsommen. Voor Conqueror keken we naar het detecteren van afhankelijkheden in de data. Afhankelijkheden in de data kunnen namelijk veel redundante patronen opleveren. Door deze echter eerst te ontdekken kunnen we vele redundanties vermijden. Ook bij het SMuRFIG algoritme keken we naar het elimineren van redundantie en veralgemeenden we enkele technieken uit standaard frequent itemset mining naar onze relationele itemsets. Hier bovenop definieerden we ook een nieuwe maat, deviation genaamd, die ons toelaat om meer focus te leggen op het ontdekken van onverwachte patronen.
Zowel voor het Conqueror algoritme als voor het SMuRFIG algoritme bekeken we in ons proefschrift enkele oplossingen voor die ik slechts kort zal opsommen. Voor Conqueror keken we naar het detecteren van afhankelijkheden in de data. Afhankelijkheden in de data kunnen namelijk veel redundante patronen opleveren. Door deze echter eerst te ontdekken kunnen we vele redundanties vermijden. Ook bij het SMuRFIG algoritme keken we naar het elimineren van redundantie en veralgemeenden we enkele technieken uit standaard frequent itemset mining naar onze relationele itemsets. Hier bovenop definieerden we ook een nieuwe maat, deviation genaamd, die ons toelaat om meer focus te leggen op het ontdekken van onverwachte patronen.
Zowel voor het Conqueror algoritme als voor het SMuRFIG algoritme bekeken we in ons proefschrift enkele oplossingen voor die ik slechts kort zal opsommen. Voor Conqueror keken we naar het detecteren van afhankelijkheden in de data. Afhankelijkheden in de data kunnen namelijk veel redundante patronen opleveren. Door deze echter eerst te ontdekken kunnen we vele redundanties vermijden. Ook bij het SMuRFIG algoritme keken we naar het elimineren van redundantie en veralgemeenden we enkele technieken uit standaard frequent itemset mining naar onze relationele itemsets. Hier bovenop definieerden we ook een nieuwe maat, deviation genaamd, die ons toelaat om meer focus te leggen op het ontdekken van onverwachte patronen.
Zowel voor het Conqueror algoritme als voor het SMuRFIG algoritme bekeken we in ons proefschrift enkele oplossingen voor die ik slechts kort zal opsommen. Voor Conqueror keken we naar het detecteren van afhankelijkheden in de data. Afhankelijkheden in de data kunnen namelijk veel redundante patronen opleveren. Door deze echter eerst te ontdekken kunnen we vele redundanties vermijden. Ook bij het SMuRFIG algoritme keken we naar het elimineren van redundantie en veralgemeenden we enkele technieken uit standaard frequent itemset mining naar onze relationele itemsets. Hier bovenop definieerden we ook een nieuwe maat, deviation genaamd, die ons toelaat om meer focus te leggen op het ontdekken van onverwachte patronen.
Met deze toevoegingen vormen zowel het Conqueror algoritme als het SMuRFIG algoritme twee praktische methoden om nieuwe patronen te ontdekken in relationele databases.
En hiermee besluit ik mijn presentatie. Ik dank u voor uw aandacht.

PhD Defense of Wim Le Page

Recommended

Recommended

More Related Content

Similar to PhD Defense of Wim Le Page

Similar to PhD Defense of Wim Le Page (16)

Recently uploaded

Recently uploaded (20)

PhD Defense of Wim Le Page

Editor's Notes