W dniu dzisiejszym Post-Mortem z użycia Uczenia Maszynowego do wykrywania Covida, ankieta „Stack Overflow Developer Survey 2021”, a także zasady bezpieczeństwa dla Kubernetesa opublikowane przez National Security Agency. Polecamy!
1. Czy AI pomogło w Pandemii?
Covid-19 mocno namieszał (i ciągle tak naprawdę miesza). Jak to mówią “szkoda zmarnować taki dobry kryzys” – sytuacja ekstremalna pozwoliła poeksperymentować z rzeczami, które wcześniej wydawały się być nierealne – jak pna przykład praca zdalna, ale nie tylko.
Od samego początku starano się walczyć z pandemią za pomocą technologii. Każdy chyba pamięta kazus Prote Go (jeśli nie – polecam bardzo “entertajning” odcinek podcastu Niebezpiecznika w temacie) i podobnych tego typu aplikacji używanych na całym świecie. Nawet twórcy mobilnych systemów operacyjnych dokładali swoją cegiełkę, tworząc specjalne API ułatwiające tak zwany “Contact Tracing”. Pandemia miała być też “stres testem” dla całego sektora Machine Learning. Artykuł z MIT Technology Review podsumowuje, jak wyglądają jego efekty.
No i coż… już po samym tytule (w wolnym tłumaczeniu “Zbudowano setki narzędzi AI do wykrywania Covid. Żadne z nich nie pomogło.”) wyglądają średnio. Publikacja punktuje pewne ogólne grzechy dzisiejszych badań naukowych, jeszcze mocniej wyolbrzymione przez szczególną wrażliwość danych medycznych. Zamiast jednego zbioru danych testowych powstawały dziesiątki małych, niekompatybilnych ze sobą, a przez to zbyt niewystarczających, żeby osiągnąć dobre wyniki. Brakło również przemyślanych instrukcji anotowania danych. Przykładowo, konkretne przypadki były określane jako Covidowe na zbyt wczesnym etapie – jeśli lekarz prowadzący stwierdził, że pacjent został zakażony. To właśnie ta informacja (a nie dane o rzeczywistym przebiegu choroby) były używane do stworzenia modeli. W ten sposób nieuniknione błędy ludzi replikowały się na algorytmy.
Na szczęście publikacja nie jest artykułem Faktu, a raportem z MIT, więc jego twórcy zamiast bawić się w “doomsaying” pochylili się nad tematem szerszej. Autorzy artykułu (a bardziej precyzyjnie – autorzy akademickiego przeglądu wyników, na którym się opiera) traktują pandemię jako lekcję, która pozwoli nam w przyszłości podejść do tematu w sposób lepszy i bardziej zorganizowany.
O ile z Covidem poszło średnio, o tyle dużo lepiej idzie modelom systematyczny rasizm. Trochę śmieszkuję, ale w zeszłym tygodniu pewną popularność na Twitterze zdobył wątek, w którym Luke Oakden-Rayner, dyrektor ds. Badań Obrazowanie Medycznego w Australijskim Instytucie Uczenia Maszynowego podzielił się wczesnymi wynikami badań dotyczących “zbiasowania” modeli MLowych pod kątem rasy.
Okazało się bowiem, że mimo usilnych prób i randomizacji, w zasadzie nie ma możliwości ukrycia przed systemami sztucznej inteligencji rasy pacjenta, nawet w tak wydawałoby się anonimowych danych jak zdjęcia rentgenowskie. W świecie, gdzie medycyna pełna jest niezamierzonego rasizmu, jest to poważny problem. Jeśli chcecie przykładów dlaczego, bardzo polecam artykuł autora (napisany bardzo w naszym stylu – szanuje panie doktorze) – na Twitterze całość w zasadzie została zalana przez rasistowski wyrzyg komentarzy bez próby wgryzienia się w temat.
Wracając zaś do tematu pracy zdalnej / hybrydowej – podejście branży cały czas ewoluuje. Amazon, chcący wysłać wszystkich do biur już we wrześniu, zapowiedział, że przesuwa powroty na styczeń 2022. Coś czuje, że wariant Delta jeszcze nam sporo namiesza.
Źródła
- Luke Oakden-Rayner on Twitter: „#Medical #AI has the worst superpower… Racism
- Prediction models for diagnosis and prognosis of covid-19: systematic review and critical appraisal
- AI has the worst superpower… medical racism. – Luke Oakden-Rayner
- Hundreds of AI tools have been built to catch covid. None of them helped.
- Amazon delays office return to January 2022 as rise of Delta variant thwarts corporate plans
Zainstaluj teraz i czytaj tylko dobre teksty!
2. Znowu Raport . Ale tym razem od StackOverflow i z masą ciekawych statystyk
Coś za dużo tych raportów ostatnio – tydzień temu mieliśmy okazję czytać przygotowany przez JetBrains, w dniu dzisiejszym trafił nam w łapy kolejny interesujący smakołyk – publikację stworzoną przez nikogo innego, jak zespół StackOverflow. W ichniejszej ankiecie Stack Overflow Developer Survey 2021 wzięło udział ponad dwa razy uczestników niż w tej twórców IntelliJ (chwalą się ponad 80 tysiącami odpowiedzi), liczba robi więc wrażenie. Mimo to, mało brakło, że pominąłbym ją w naszym dzisiejszym przeglądzie, nie chcąc duplikować tematów z tygodnia na tydzień. Byłby to błąd, bowiem StackOverflow przyglądnął się naszej branży od trochę innej strony i ich raport zawiera sporo interesujących statystyk.
Ze względu na domenę w której działa Vived, moją uwagę przykuły trendy w sposobie nauki programowania z podziałem na demografię. Jak widać, klasyczne książki mocno tracą na znaczeniu, podobnie jest ze szkołą. Co zyskuje? Coraz większą popularnością (i jest to mocno widoczny trend) cieszą się “inne materiały”, co rozumiane jest jako blogi czy materiały wideo. Podobnego wzrostu nie widać jednak w Bootcampach oraz tak zwanych MOOCach – obie kategorie zdobywają popularność, ale nie tak dynamicznie jak by się mogło wydawać.
Kolejną bardzo kontrintuicyjną rzeczą w raporcie jest ilość doświadczenia programistycznego w z zależności od zajmowanej pozycji. O ile rozumiem, że prawie wszyscy biorący udział w ankiecie StackOverflow to są ludzie z zapleczem technicznym, ale zdziwiła mnie mocno ilość lat doświadczenia programistycznego przeciętnego Produkt Managera. I nie mówimy tu też o jakichś homeopatycznych ilościach respondentów – odpowiedzi od PMów (2,829) było prawie tyle samo co tych od Enigineering Managerów (3,652). Czyżby Product Manager był coraz popularniejszą ścieżką rozwojową dla “seniorów”? Będziemy się temu przyglądać.
Oczywiście, czymś co zawsze elektryzuje są zarobki. Jeśli jesteście programistami języków funkcyjnych – gratulacje, pierwsze dwa miejsca zajmują bowiem Clojure (95 000 $ rocznie), i F# (83 000$). Tą dwójkę gonią zaś Erlang i Elixir. Pokazuje to trochę, że im większa nisza, tym lepsze pieniądze – popularne technologie jak Java czy JavaScript okupują raczej dół rankingu… podobnie jak Cobol . Ciekawe jak ma się to do mitu niesamowicie zarabiających Cobolowców. Jeśli chodzi o bazy danych, najlepszymi zarobkami mogą pochwalić się specjaliści od DynamoDB, w konkretnych frameworkach przoduje Ruby on Rails oraz… Svelte. Ogólnie zaś jeśli mielibyśmy wybrać jedną konkretną technologię, która jest predyktorem wysokich zarobków, byłoby to Pulumi – specjaliści w tym frameworku Infrastructure-as-a-Code średnio zarabiają 109 000 dolarów.
Ale nie będę was dalej zanudzał – jeśli chcecie spędzić trochę czasu z cyferkami w ten weekend, raport StackOverflow będzie dość dobrym źródłem.
Źródło
Zainstaluj teraz i czytaj tylko dobre teksty!
3. NSA publikuje zasady bezpieczeństwa dla Kubernetesa
A na koniec trochę bezpieczeństwa.
W tym tygodniu wpadła nam w rączki nie lada perełka – bo przyznajcie, niecodziennie macie okazję czytać poradnik zabezpieczeń infrastruktury chmurowej, napisany przez specjalistów z National Security Agaency (lepiej znanego jako NSA).
Raport zawiera szczegółowe zalecenia dotyczące “hardeningu” Kubernetesa. Poza podstawowymi działaniami, takimi jak skanowanie kontenerów i podów w poszukiwaniu luk w zabezpieczeniach lub błędnych konfiguracjach, bardzo mocno skupia się na technikach – jak uruchamianie kontenerów i podów z możliwie najmniejszymi uprawnieniami czy odpowiednia separacja networków. Podkreśla też wagę silnego uwierzytelniania i audytu logów. Ogólnie mamy do czynienia z przeszło sześdziesięciostronicowym bydlęciem. O ile nie zdążyłem jeszcze dogłębnie przebić się przez całość, to już nawet pobieżne przeglądniecie PDFa ukazuje nam bardzo kompetentny (a dodatkowo – napisany zaskakująco przyjaznym językiem) poradnik, opatrzony dodatkowo mocarną listą źródeł pogłębiających. Jeśli pełna lektura, do której siąde w wolniejszej chwili, potwierdzi pierwsze obserwacje, całość stanie się chyba jednym z moich “sztandarowych” materiałów w tym temacie.
Dodatkowo, przy okazji Raportu odkryłem, że to nie jedyny tego typu przewodnik opublikowany przez NSA. Agencja ma ich całą bazę, dotykającą szerokiego spektrum tematów. Co prawda, większość z nich jest dość hermetyczna, ale np. udało mi się wygrzebać szczegółową analizę bezpieczeństwa oprogramowania do pracy zdalnej czy raport z najczęściej wykorzystywanych podatności chmur obliczeniowych. Lista pełna jest też tak zwanych Zero-Days.
Źródła
- Kubernetes Hardening Guidance
- NSA’s Cybersecurity Advisories & Technical Guidance
- National Security Agency | Cybersecurity Information Selecting and Safely Using Collaboration Services for Telework – UPDATE
- Mitigating Cloud Vulnerabilities
Pamiętajcie, żeby spróbować Vived, jeśli chcesz otrzymywać tego typu treści spersonalizowane pod Ciebie!