Forskarutbildningsämne: Electrical Engineering
Förstärkningsinlärning (Reinforcement Learning, RL) hanterar sekventiella beslutsproblem genom att agera i en miljö och successivt förbättra sitt beteende via trial-and-error. Dessa metoder har visat anmärkningsvärda framgångar inom flera områden – ibland till och med överträffat mänsklig prestation. En stor nackdel är dock att de kräver enorma mängder träningsdata för att uppnå sådana resultat. Inom områden som datorspel eller rekommendationssystem finns det gott om träningsdata. Inom exempelvis finans eller sjukvård kan datainsamling däremot vara riskfylld, kostsam eller till och med juridiskt begränsad.
RL-algoritmer kan grovt delas in i två kategorier: modellfria och modellbaserade. Modelfria metoder lär sig direkt från interaktioner med den verkliga (mål)miljön, medan modellbaserade metoder tränar agenter med hjälp av en inlärd modell av miljön. Modellbaserade metoder är generellt sett mer dataeffektiva än modellfria, men de är inte utan utmaningar – de två mest kritiska är ackumulerade fel och Sim2Real-klyftan (gapet mellan simulering och verklighet).
Syftet med denna avhandling är att ta itu med dessa problem genom att utforska innovativa diffusionsmodeller. Dessa modeller ska användas för att förbättra både inlärningsprocessen och robustheten hos den inlärda policyn i RL. Vi planerar specifikt att använda styrningstekniker inom diffusionsmodellerna för att rikta genereringen av trajektorier mot sådana som är mest fördelaktiga för inlärningen. Med ”fördelaktiga” syftar vi på två centrala aspekter:
Att främja policies som är robusta mot modelleringsfel och anpassningsbara till okända miljöer.
Att snabba upp inlärningen och därmed förbättra dataeffektiviteten.
Vi kommer även att undersöka sätt att ge analytiska garantier för dessa metoder.
Handledning: Prof. Alexandre Proutiere
För att bli antagen till forskarutbildning (kap 7 39 § högskoleförordningen) krävs att den sökande har grundläggande behörighet:
Utöver ovanstående finns också ett obligatoriskt krav på engelska motsvarande Engelska B/6.
För att lyckas med dina doktorandstudier på KTH behöver du vara målinriktad och ihärdig i ditt arbete. Vid urval av de sökande bedöms förmågan att:
En stark bakgrund inom statistik, sannolikhetslära och optimering är önskvärd
Efter behörighetskraven kommer stor vikt läggas vid personliga egenskaper.
Målexamen: Doktorsexamen
Endast den som antagits till forskarutbildning får anställas som doktorand. Den sammanlagda anställningstiden får inte vara längre än vad som motsvarar utbildning på forskarnivå på heltid under fyra år. En anställd doktorand kan i begränsad omfattning (högst 20 %) utföra vissa arbetsuppgifter inom t.ex. utbildning och administration. En ny anställning som doktorand gäller för högst ett år, anställningen får därefter förnyas med högst två år i taget. Vid studier som ska avslutas med licentiatexamen får den sammanlagda anställningstiden inte vara längre än vad som motsvarar utbildning på forskarnivå på heltid under två år.
Kontaktuppgifter till fackliga representanter.
Kontaktuppgifter till doktorandsektionen.
Du ansöker via KTH:s rekryteringssystem. Du som sökande har huvudansvaret för att din ansökan är komplett när den skickas in.
Ansökan ska vara KTH tillhanda senast sista ansökningsdagen vid midnatt, CET/CEST (Central European Time/Central European Summer Time).
Ansökan ska ha följande innehåll
Strävan efter jämställdhet, mångfald och lika villkor är både en kvalitetsfråga och en självklar del av KTH:s värdegrund
För information om behandling av personuppgifter i samband med rekrytering.
Det kan förekomma att en anställning hos KTH är placerad i säkerhetsklass. Om så är fallet för just denna anställning görs en säkerhetsprövning av sökande i enlighet med säkerhetsskyddslagen (2018:585) efter samtycke. I dessa fall är en förutsättning för anställning att sökande blir godkänd efter säkerhetsprövning.
Vi undanber oss direktkontakt med bemannings- och rekryteringsföretag samt försäljare av platsannonser.
Anställningsform | Tidsbegränsad anställning |
---|---|
Anställningens omfattning | Heltid |
Tillträde | Enligt ök |
Löneform | Månadslön enligt KTH:s avtal för doktorandlöner |
Antal lediga befattningar | 2 |
Sysselsättningsgrad | 100% |
Ort | Stockholm |
Län | Stockholms län |
Land | Sverige |
Referensnummer | PA-2025-1789 |
Kontakt |
|
Publicerat | 2025-06-05 |
Sista ansökningsdag | 2025-08-12 |