Mehr als 300 verschiedene Dateiformate einfach & effizient durchsuchen

 

Informationen finden leicht gemacht: Die unternehmensinterne Suchmaschine searchit ermöglicht das Durchsuchen nahezu jedes Dateiformats in Millionen von Dateien auf lokalen Fileservern, Mailservern und Archiven.

Suchen, Finden, Sparen mit searchit

Effiziente Suche in allen Microsoft Office Dateiformaten, Portable Document Format – PDFs –, XML-Formate und vielen weiteren!

Wie werden Dateien in searchit durchsucht?

Was sind MIME-Types?

Unterstützte Kategorien von Dateiformaten

Vollständige Liste der durchsuchbaren MIME-Types

Logo searchit

Das Durchsuchen nahezu jedes Dateiformats ist eine der größten Stärken der Enterprise Search Lösung searchit. Im Gegensatz zur Suche im File Explorer kann der Dateiinhalt inklusive Metadaten aller indizierten Dateien durchsucht werden, sogar bei Formaten für Scans, Bilder oder CAD-Dateien. Finden Sie heraus, wie genau searchit Undurchsuchbares durchsuchbar macht und scrollen Sie durch die vollständige Liste aller unterstützten Dateiformate.

Wie werden Dateien in searchit durchsucht?

Als Enterprise Search Lösung ermöglicht searchit die umfassende Durchsuchung von Dateien durch intelligente Indexierung und Kategorisierung. Nutzer können schnell und effizient nach Inhalten in verschiedenen Formaten wie Dokumenten, E-Mails, Präsentationen und mehr suchen, um relevante Informationen zu finden und die Produktivität zu steigern.

Was sind MIME-Types?

 

MIME-Types (Multipurpose Internet Mail Extensions) sind Kennzeichnungen, die den Medientyp von Dateien im Internet definieren. Sie ermöglichen die korrekte Interpretation und Verarbeitung von Inhalten, indem sie den Servern und Browsern den Dateityp mitteilen.

Unterstützte Kategorien von Dateiformaten

Der Anwalt wühlt sich tagtäglich durch E-Mail-Archive, die Vorarbeiterin durch CAD-Dateien – das meist-genutzte Dateiformat ist sowohl Branchen- als auch Job-abhängig. searchits ständig wachsende Anzahl an Parsern ermöglicht das Durchsuchen in beinahe allen Datei-Kategorien.

HTML (Hypertext Markup Language)

Die lingua franca des Webs – Nahezu jedes auf dem Web gefunden HTML-Format wird mit der searchit Suchfunktion unterstützt:

  • Gültigen XHTML-Code und XML
  • Microsoft Office-Dokumentenformate
  • OpenDocument
  • iWorks
  • Portable Document Formate
  • EPUB
  • RTF
  • Komprimierungs- und Verpackungsformate
  • Audio-, Bild- und Videoformate
  • Und weitere wissenschaftliche, sprachverarbeitende, objekterkennende und datenbankbasierte Formate

XML und abgeleitete Formate

Das Extensible Markup Language (XML) Format wird sowohl für hierarchisch strukturierte Daten wie auch für einen plattformunabhängigen Austausch von Daten zwischen Computersystemen eingesetzt. Zu den von searchit unterstützten XML-Sprachen zählen:

  • XHTML (Extensible Hypertext Markup Language)
  • OOXML (Office Open XML)
  • ODF (Open Document Format)

Microsoft Office-Dokumentformate

Text- und Metadatenextraktion aus Microsoft Office und einige verwandte Anwendungen können in den folgenden Formaten durchsucht werden:

  • OLE 2 Compound Document Format
  • OOXML (Office Open XML)
  • Temporäre Office-Sperrdateien (Owner-Dateien)

OpenDocument-Format

searchit durchsucht das OpenDocument-Format (ODF) für:

  • Alle Dateien der OpenOffice.org-Office-Suite
  • Ältere Dateien im OpenOffice 1.0-Format, der Vorgänger von ODF

iWorks-Dokumentformate

Sowohl Text- als auch Metadaten werden in iWorks unterstützt, inklusive:

  • Numbers
  • Pages
  • Keynotes

WordPerfect-Dokumentformate

searchit durchsucht alle Formate zugehörig zu:

  • Corel WordPerfect Office Suite
  • WordPerfect WP6+-Dateien
  • QuattroPro QPW v9+-Dateien

Portable Document Format

Digital erstellte und nicht-durchsuchbare Scans werden in searchit mittels der ORC-Funktionalität durchsuchbar gemacht. Mehr zur PDF-Suche mit searchit.

Electronic Publication Format

searchit durchsucht eBooks, digitale Bücher und Paper in den den folgenden Formaten:

  • Electronic Publication Format (EPUB)
  • Fiction Book Publishing Format

Rich Text Format

Volle Suchfunktionalität für Dokumente im Rich Text Format (RTF).

Komprimierung und Verpackungsformate

Enterprise Search Software searchit ermöglicht das Suchen selbst in komprimierten Daten. Verschiedene Kompressions- und Paketierungsformate werden unterstützt:

  • Tar
  • AR
  • ARJ
  • CPIO
  • Dump
  • Zip
  • 7Zip
  • Gzip
  • BZip2
  • XZ
  • LZMA
  • Z
  • Pack200
  • RAR
  • AppleSingle- und
  • AppleDouble-Dateien

Text-Formate

Das Extrahieren von Textinhalten aus einfachen Textdateien scheint eine einfache Aufgabe zu sein, bis man anfängt, an all die möglichen Zeichenkodierungen zu denken. searchit ist in der Lage die Zeichenkodierung eines Textdokuments automatisch zu erkennen.

Feed- und Syndication-Formate

Updates von Websites, Podcasts oder Newsartikeln – searchit unterstützt Syndikationsformate mit denen Nutzer immer am neuesten Stand bleiben:

  • RSS Feed
  • Atom Feed
  • IPTC ANPA News Wire Feed Format

Hilfe-Formate

searchit durchsucht die Microsoft Hilfe-Dateien:

  • CHM-Hilfeformat ( genannat Compiled HTML Help, auch Compressed HTML Help oder Compiled Help Module(s))

Video-Formate

Videoaufnahmen in den am meist-verbreiteten Formaten werden mit serachit mit Fokus auf Metadaten durchsucht:

  • Flash-Videoformat
  • MP4-Familie von Videoformaten inklusive MP4, Quicktime, 3GPP u.v.m.
  • Ogg-Familie von Videoformaten

Java-Klassendateien und Archive

Klassennamen und Methodensignaturen  werden in searchit in den folgenden Formaten durchsucht:

  • Java-Klassendateien
  • jar-Archive

Source Code

searchit durchsucht selbst Quellcode nach Inhalt und Metadaten:

  • Java
  • C
  • C++ Groovy
  • und weitere!

E-Mail-Formate

Das Durchsuchen von Mails und selbst E-Mail-Archiven macht searchit in den folgenden Formaten möglich:

  • PST-E-Mail-Format, im Einsatz bei Microsoft Outlook Archiven
  • MSG-E-Mail-Format, im Einsatz bei einzeln heruntergeladenen Outlook-Mails
  • Microsoft TNEF (Transport Neutral Encoding Format, auch bekannt als Winmail.dat), von den meisten Microsoft E-Mail-Clients für E-Mail-Anhänge verwendet
  • mbox-Format, weit-verbreitet bei E-Mail-Archiven und Unix-ähnlichen Mailboxen
  • RFC 822-Format: Verwendet von vielen E-Mail-Clients in Archiven und Exporten

CAD-Formate

searchit durchsucht Metdaten von Dateien im DWG-CAD-Format.

Schriftformate

Selbst in Schrift-Dateien nach Metadaten suchen – searchit unterstützt:

  • TrueType-Schriftformat
  • Adobe Font Metrics-Dateien

Wissenschaftliche Formate

Viele der Programme, die spezifisch in der Wissenschaft angewendet werden, können mit searchit nach Metadaten und Inhalt durchsucht werden:

  • GCMD Directory Interchange Format (DIF)
  • GDAL
  • ISO-19139-Dateiformat für georgraphische Informationen
  • Grib
  • HDF
  • Familie der Dateiformate ISA-Tab (ISA Tools)
  • NetCDF
  • Matlab

Ausführbare Programme und Bibliotheken

Mit searchit werden Metadateninformationen über Plattformen, Architekturen und Typen aus einer Reihe von ausführbaren Formaten und Bibliotheken extrahiert und durchsucht:

  • Windows-Executables
  • Linux/BSD-Programmen und -Bibliotheken
  • und viele weitere!

Krypto-Formate

Durch sichere Zugriffsregelungen und mittels spezieller Parser durchsucht searchit sogar verschlüsselte Nachrichten:

  • PKCS7-signierte Nachrichten, ohne Informationen aus dem äußeren PKCS7-Wrapper
  • Metadaten aus Time Stamped Data Envelope-Dateien (TSD)
  • Gespeicherte Inhalte aus dem TSD-Wrapper

Datenbankformate

Mehrere Typen von Datenbanken können in searchit schnell und unkompliziert durchsucht werden:

  • SQLite3-Dateien
  • Microsoft Access-Datenbankdateien
  • dBase-Dateien (dbf) inklusive dBase, FoxBASE, FoxPRO und Shapefile-Format von ESRI

Verarbeitung natürlicher Sprache

Künstliche Intelligenz kommt bei searchit z. B. mittels Natural Language Processing- sowie Named Entity Recognition-Frameworks zum Einsatz. Dies ermöglicht:

  • Klassifizierung der Stimmung und emotionalen Ton eines Dokuments
  • Extrahierung von Metadaten aus Volltext von Zeitschriftenpublikationen zu extrahieren.

Bild- und Video-Objekterkennung

Mehrere Objekterkennungs-Frameworks werden unterstützt, um den Inhalt von Bildern und Videos zu analysieren. searchit Instanzen werden dabei mit große Trainingsdatensätzen auf spezifische Anwendungsbereiche von Kunden trainiert.

Wissen was drinsteht - ohne Rücksicht auf's Dateiformat

Dank searchit können Sie auf einer zentralen Plattform in hunderten Dateiformaten gleichzeitig suchen

Vollständige Liste der durchsuchbaren MIME-Types

Über dreihundert Formate für Textdateien, Bilder und Scans, PDFs und vieles mehr werden in searchit unterstützt:

AppleSingleFileParse

  • application/applefile

PListParser

  • application/x-plist
  • application/x-bplist-itunes
  • application/x-bplist
  • application/x-bplist-memgraph
  • application/x-bplist-webarchive

ClassParser

  • application/java-vm

AudioParser

  • audio/vnd.wave
  • audio/x-wav
  • audio/basic
  • audio/x-aiff

MidiParser

  • application/x-midi
  • audio/midi

SourceCodeParser

  • text/x-c++src
  • text/x-groovy
  • text/x-java-source

Pkcs7Parser

  • application/pkcs7-signature
  • application/pkcs7-mime

TSDParser

  • application/timestamped-data

TextAndCSVParser

  • text/csv
  • text/tsv
  • text/plain

DBFParser

  • application/x-dbf

DGN8Parser

  • image/vnd.dgn; version=8

DIFParser

  • application/dif+xml

DWGParser

EpubParser

  • application/x-ibooks+zip
  • application/epub+zip

ExecutableParser

  • application/x-msdownload
  • application/x-sharedlib
  • application/x-elf
  • application/x-object
  • application/x-executable
  • application/x-coredump

ExternalParser

  • video/avi
  • video/mpeg
  • video/x-msvideo
  • video/mp4

FeedParser

  • application/atom+xml
  • application/rss+xml

AdobeFontMetricParser

  • application/x-font-adobe-metric

TrueTypeParser

  • application/x-font-ttf

HtmlParser

  • text/html
  • application/vnd.wap.xhtml+xml
  • application/x-asp
  • application/xhtml+xml

HttpParser

  • application/x-httpresponse

HwpV5Parser

  • application/x-hwp-v5

BPGParser

  • image/bpg
  • image/x-bpg

HeifParser

  • image/heic-sequence
  • image/heif
  • image/heic
  • image/heif-sequence

ICNSParser

  • image/icns

ImageParser

  • image/png
  • image/vnd.wap.wbmp
  • image/x-jbig2
  • image/bmp
  • image/x-xcf
  • image/gif
  • image/x-icon
  • image/x-ms-bmp

JXLParser

  • image/jxl

JpegParser

  • image/jpeg

PSDParser

  • image/vnd.adobe.photoshop

TiffParser

WebPParser

  • image/webp

IDMLParser

  • application/vnd.adobe.indesign-idml-package

IptcAnpaParser

  • text/vnd.iptc.anpa

IWorkPackageParser

  • application/vnd.apple.keynote
  • application/vnd.apple.iwork
  • application/vnd.apple.numbers
  • application/vnd.apple.pages

IWork13PackageParser

  • application/vnd.apple.numbers.13
  • application/vnd.apple.unknown.13
  • application/vnd.apple.pages.13
  • application/vnd.apple.keynote.13

IWork18PackageParser

  • application/vnd.apple.pages.18
  • application/vnd.apple.keynote.18
  • application/vnd.apple.numbers.18

RFC822Parser

  • message/rfc822

MatParser

  • application/x-matlab-data

MboxParser

  • application/mbox

EMFParser

  • image/emf

JackcessParser

  • application/x-msaccess

MSOwnerFileParser

OfficeParser

OldExcelParser

TNEFParser

  • application/vnd.ms-tnef
  • application/x-tnef
  • application/ms-tnef

WMFParser

  • image/wmf

ActiveMimeParser

  • application/x-activemime

ChmParser

  • application/vnd.ms-htmlhelp
  • application/x-chm
  • application/chm

OneNoteParser

  • application/onenote; format=one

OOXMLParser

  • application/vnd.ms-powerpoint.template.macroenabled.12
  • application/vnd.ms-excel.addin.macroenabled.12
  • application/vnd.openxmlformats-officedocument.wordprocessingml.template
  • application/vnd.ms-excel.sheet.binary.macroenabled.12
  • application/vnd.openxmlformats-officedocument.wordprocessingml.document
  • application/vnd.ms-powerpoint.slide.macroenabled.12
  • application/vnd.ms-visio.drawing
  • application/vnd.ms-powerpoint.slideshow.macroenabled.12
  • application/vnd.ms-powerpoint.presentation.macroenabled.12
  • application/vnd.openxmlformats-officedocument.presentationml.slide
  • application/vnd.ms-excel.sheet.macroenabled.12
  • application/vnd.ms-word.template.macroenabled.12
  • application/vnd.ms-word.document.macroenabled.12
  • application/vnd.ms-powerpoint.addin.macroenabled.12
  • application/vnd.openxmlformats-officedocument.spreadsheetml.template
  • application/vnd.ms-xpsdocument
  • application/vnd.ms-visio.drawing.macroenabled.12
  • application/vnd.ms-visio.template.macroenabled.12
  • model/vnd.dwfx+xps
  • application/vnd.openxmlformats-officedocument.presentationml.template
  • application/vnd.openxmlformats-officedocument.presentationml.presentation
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheet
  • application/vnd.ms-visio.stencil
  • application/vnd.ms-visio.template
  • application/vnd.openxmlformats-officedocument.presentationml.slideshow
  • application/vnd.ms-visio.stencil.macroenabled.12
  • application/vnd.ms-excel.template.macroenabled.12

Word2006MLParser

pst.OutlookPSTParser

rtf.RTFParser

  • application/rtf

xml.SpreadsheetMLParser

  • application/vnd.ms-spreadsheetml

xml.WordMLParser

  • application/vnd.ms-wordml

MIFParser

  • application/x-mif
  • application/vnd.mif
  • application/x-maker

Mp3Parser

  • audio/mpeg

MP4Parser

  • video/x-m4v
  • application/mp4
  • video/3gpp
  • video/3gpp2
  • video/quicktime
  • audio/mp4
  • video/mp4

TesseractOCRParser

  • image/ocr-x-portable-pixmap
  • image/ocr-jpx
  • image/x-portable-pixmap
  • image/ocr-jpeg
  • image/ocr-jp2
  • image/jpx
  • image/ocr-png
  • image/ocr-tiff
  • image/ocr-gif
  • image/ocr-bmp
  • image/jp2

FlatOpenDocumentParser

  • application/vnd.oasis.opendocument.tika.flat.document
  • application/vnd.oasis.opendocument.flat.presentation
  • application/vnd.oasis.opendocument.flat.spreadsheet
  • application/vnd.oasis.opendocument.flat.text

OpenDocumentParser

  • application/x-vnd.oasis.opendocument.presentation
  • application/vnd.oasis.opendocument.chart
  • application/x-vnd.oasis.opendocument.text-web
  • application/x-vnd.oasis.opendocument.image
  • application/vnd.oasis.opendocument.graphics-template
  • application/vnd.oasis.opendocument.text-web
  • application/x-vnd.oasis.opendocument.spreadsheet-template
  • application/vnd.oasis.opendocument.spreadsheet-template
  • application/vnd.sun.xml.writer
  • application/x-vnd.oasis.opendocument.graphics-template
  • application/vnd.oasis.opendocument.graphics
  • application/vnd.oasis.opendocument.spreadsheet
  • application/x-vnd.oasis.opendocument.chart
  • application/x-vnd.oasis.opendocument.spreadsheet
  • application/vnd.oasis.opendocument.image
  • application/x-vnd.oasis.opendocument.text
  • application/x-vnd.oasis.opendocument.text-template
  • application/vnd.oasis.opendocument.formula-template
  • application/x-vnd.oasis.opendocument.formula
  • application/vnd.oasis.opendocument.image-template
  • application/x-vnd.oasis.opendocument.image-template
  • application/x-vnd.oasis.opendocument.presentation-template
  • application/vnd.oasis.opendocument.presentation-template
  • application/vnd.oasis.opendocument.text
  • application/vnd.oasis.opendocument.text-template
  • application/vnd.oasis.opendocument.chart-template
  • application/x-vnd.oasis.opendocument.chart-template
  • application/x-vnd.oasis.opendocument.formula-template
  • application/x-vnd.oasis.opendocument.text-master
  • application/vnd.oasis.opendocument.presentation
  • application/x-vnd.oasis.opendocument.graphics
  • application/vnd.oasis.opendocument.formula
  • application/vnd.oasis.opendocument.text-master

PDFParser

CompressorParser

PackageParser

  • application/x-tar
  • application/java-archive
  • application/x-arj
  • application/x-archive
  • application/zip
  • application/x-cpio
  • application/x-tika-unix-dump
  • application/x-7z-compressed

RarParser

  • application/x-rar-compressed

PRTParser

  • application/x-prt

SAS7BDATParser

  • application/x-sas-data

TMXParser

  • application/x-tmx

FLVParser

  • video/x-flv

WACZParser

  • application/x-wacz

WARCParser

  • application/warc
  • application/warc+gz

QuattroProParser

  • application/x-quattro-pro; version=9

WordPerfectParser

  • application/vnd.wordperfect; version=5.1
  • application/vnd.wordperfect; version=5.0
  • application/vnd.wordperfect; version=6.x

XLIFF12Parser

  • application/x-xliff+xml

XLZParser

  • application/x-xliff+zip

DcXMLParser

  • application/xml
  • image/svg+xml

FictionBookParser

  • application/x-fictionbook+xml

FlacParser

  • audio/x-oggflac
  • audio/x-flac

OggParser

  • audio/ogg
  • application/kate
  • application/ogg
  • video/daala
  • video/x-ogguvs
  • video/x-ogm
  • audio/x-oggpcm
  • video/ogg
  • video/x-dirac
  • video/x-oggrgb
  • video/x-oggyuv

OpusParser

  • audio/opus
  • audio/ogg; codecs=opus

SpeexParser

  • audio/ogg; codecs=speex
  • audio/speex

TheoraParser

  • video/theora

VorbisParser

  • audio/vorbis

 

Kontakt

Wir setzen auf ganzheitlichen Service & auf eine High End Enterprise Search Engine. Kontaktieren Sie uns.